NycTlcYellow Classe

Representa o conjunto de dados público de corrida de táxi amarelo da Comissão de Táxi & Limusine de NYC.

Os registros de viagem de táxi amarelo incluem campos capturando datas/horários de retirada e entrega, locais de retirada e entrega, distâncias de viagem, tarifas itemizadas, tipos de taxa, tipos de pagamento e contagens de passageiros relatadas pelo motorista. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de colunas, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte NYC Taxi &Limão Commission – registros de viagem de táxi amarelo no catálogo do Microsoft Azure Open Datasets.

Inicializar campos de filtragem.

Construtor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Nome Description
start_date

A data em que iniciar o carregamento de dados, inclusive. Se Nenhum, o default_start_date valor será usado.

Valor padrão: 2015-01-01 00:00:00
end_date

A data em que terminar o carregamento de dados, inclusive. Se Nenhum, o default_end_date valor será usado.

Valor padrão: 2024-12-13 00:00:00
cols

Uma lista de nomes de colunas a serem carregados do conjunto de dados. Se Nenhum, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte NYC Taxi &Limão Commission - registros de viagem de táxi amarelo.

Valor padrão: None
limit
int

Um valor que indica o número de dias de dados a serem carregados com to_pandas_dataframe(). Se não for especificado, o padrão de -1 significa nenhum limite de dias carregados.

Valor padrão: -1
enable_telemetry

Se deseja habilitar a telemetria nesse conjunto de dados.

Valor padrão: True
start_date
Obrigatório

A data de início que você gostaria de consultar inclusive.

end_date
Obrigatório

A data de término que você gostaria de consultar inclusive.

cols
Obrigatório

Uma lista de nomes de coluna que você gostaria de recuperar. Nenhuma obterá todas as colunas.

limit
Obrigatório
int

to_pandas_dataframe() carregará apenas "limite" meses de dados. -1 significa que não há limite.

enable_telemetry
Obrigatório

Indica se é necessário enviar telemetria.

Comentários

O exemplo a seguir mostra como acessar o conjunto de dados.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()