5 datasets found
  1. Data Expo 2009: Airline On Time Data

    • kaggle.com
    Updated Mar 20, 2022
    Share
    FacebookFacebook
    TwitterTwitter
    Email
    Click to copy link
    Link copied
    Close
    Cite
    果丹皮 (2022). Data Expo 2009: Airline On Time Data [Dataset]. https://www.kaggle.com/datasets/wenxingdi/data-expo-2009-airline-on-time-data
    Explore at:
    CroissantCroissant is a format for machine-learning datasets. Learn more about this at mlcommons.org/croissant.
    Dataset updated
    Mar 20, 2022
    Dataset provided by
    Kagglehttp://kaggle.com/
    Authors
    果丹皮
    License

    https://creativecommons.org/publicdomain/zero/1.0/https://creativecommons.org/publicdomain/zero/1.0/

    Description

    Have you ever been stuck in an airport because your flight was delayed or cancelled and wondered if you could have predicted it if you'd had more data? This is your chance to find out.

    The 2009 ASA Statistical Computing and Graphics Data Expo consisted of flight arrival and departure details for all commercial flights on major carriers within the USA, from October 1987 to April 2008. This is a large dataset containing nearly 120 million records in total.

    The aim of the data expo is to provide a graphical summary of important features of the data set. This is intentionally vague in order to allow different entries to focus on different aspects of the data, but here are a few ideas to get you started: •When is the best time of day, day of the week, and time of year to fly to minimise delays? •Do older planes suffer more delays? •How well does weather predict plane delays? •How does the number of people flying between different locations change over time? •Can you detect cascading failures as delays in one airport create delays in others? Are there critical links in the system? •Use the available variables to construct a model that predicts delays.

  2. Data from: US Airports

    • kaggle.com
    Updated Jul 21, 2022
    Share
    FacebookFacebook
    TwitterTwitter
    Email
    Click to copy link
    Link copied
    Close
    Cite
    Ms. Nancy Al Aswad (2022). US Airports [Dataset]. https://www.kaggle.com/datasets/nancyalaswad90/us-airports/data
    Explore at:
    CroissantCroissant is a format for machine-learning datasets. Learn more about this at mlcommons.org/croissant.
    Dataset updated
    Jul 21, 2022
    Dataset provided by
    Kagglehttp://kaggle.com/
    Authors
    Ms. Nancy Al Aswad
    License

    https://creativecommons.org/publicdomain/zero/1.0/https://creativecommons.org/publicdomain/zero/1.0/

    Area covered
    United States
    Description

    What is Data Expo 2009 - Airline on-time performance?

    Have you ever been stuck in an airport because your flight was delayed or canceled and wondered if you could have predicted it if you'd had more data? This is your chance to find out.

    .

    How to use this dataset

    We had a total of nine entries, and turn ou at the poster session at the JSM was great, with plenty of people stopping by to find out why their flights were delayed.

    Acknowledgments

    When we use this dataset in our research, we credit the authors.

    The main idea for uploading this dataset is to practice data analysis with my students, as I am working in college and want my student to train our studying ideas in a big dataset, It may be not up to date and I mention the collecting years, but it is a good resource of data to practice

  3. Airlines Delay

    • kaggle.com
    Updated Nov 14, 2019
    + more versions
    Share
    FacebookFacebook
    TwitterTwitter
    Email
    Click to copy link
    Link copied
    Close
    Cite
    Giovanni Gonzalez (2019). Airlines Delay [Dataset]. https://www.kaggle.com/datasets/giovamata/airlinedelaycauses/discussion
    Explore at:
    CroissantCroissant is a format for machine-learning datasets. Learn more about this at mlcommons.org/croissant.
    Dataset updated
    Nov 14, 2019
    Dataset provided by
    Kagglehttp://kaggle.com/
    Authors
    Giovanni Gonzalez
    Description

    The U.S. Department of Transportation's (DOT) Bureau of Transportation Statistics (BTS) tracks the on-time performance of domestic flights operated by large air carriers. Summary information on the number of on-time, delayed, canceled and diverted flights appears in DOT's monthly Air Travel Consumer Report, published about 30 days after the month's end, as well as in summary tables posted on this website. BTS began collecting details on the causes of flight delays in June 2003. Summary statistics and raw data are made available to the public at the time the Air Travel Consumer Report is released.

    This version of the dataset was compiled from the Statistical Computing Statistical Graphics 2009 Data Expo and is also available here.

  4. n

    Data from: E3 (Electronic Entertainment Expo)

    • wikimedia.az-az.nina.az
    Updated Jun 17, 2024
    + more versions
    Share
    FacebookFacebook
    TwitterTwitter
    Email
    Click to copy link
    Link copied
    Close
    Cite
    (2024). E3 (Electronic Entertainment Expo) [Dataset]. https://www.wikimedia.az-az.nina.az/E3_(Electronic_Entertainment_Expo).html
    Explore at:
    Dataset updated
    Jun 17, 2024
    License

    Attribution 4.0 (CC BY 4.0)https://creativecommons.org/licenses/by/4.0/
    License information was derived automatically

    Description

    Electronic Entertainment Expo E 2006 2008 ci illər ərzində E Media and Business Summit hər il keçirilən videooyun sərgil

  5. d

    Estadísticas de Exportaciones - EXPO - 2005 A 2010 - Colombia

    • microdatos.dane.gov.co
    Updated Nov 20, 2023
    + more versions
    Share
    FacebookFacebook
    TwitterTwitter
    Email
    Click to copy link
    Link copied
    Close
    Cite
    Dirección de Metodología y Producción Estadística - DIMPE (2023). Estadísticas de Exportaciones - EXPO - 2005 A 2010 - Colombia [Dataset]. https://microdatos.dane.gov.co/index.php/catalog/554
    Explore at:
    Dataset updated
    Nov 20, 2023
    Dataset provided by
    Dirección de Metodología y Producción Estadística - DIMPE
    Fase 1: (Enero 2008-diciembre 2016), Publicación (31 de Diciembre 2017).
    Fase 3: (Años 1970 - 1990), Publicación ( 4 de mayo de 2018).
    Fase 2: (Enero 1991- diciembre 2007), Publicación ( 4 de mayo de 2018).
    Time period covered
    2005 - 2010
    Area covered
    Colombia
    Description

    Resumen

    Las estadísticas de exportaciones de mercancías registran la salida legal de mercancías hacia otro país o una zona franca industrial colombiana. Estas estadísticas se producen con base en las declaraciones de exportaciones1 presentadas ante las diferentes administraciones de aduanas del país. De igual forma, las exportaciones se registran estadísticamente cuando la aduana ha realizado el cierre de la declaración de exportación.

    Las estadísticas colombianas son producidas y publicadas según recomendaciones de organismos internacionales competentes; sin embargo, la aplicación de dichas sugerencias se revisa en forma periódica en un proceso interinstitucional en el cual participan el DANE, el Banco de la República, la DIAN y el Ministerio de Industria, Comercio y Turismo.

    La investigación busca satisfacer las necesidades y exigencias de las personas, instituciones y organismos nacionales e internacionales, dedicados a investigaciones relacionadas con la venta de mercancías al exterior. Es imprescindible contar periódicamente con estadísticas que refl ejen la evolución y el comportamiento de estas actividades en el ámbito nacional, teniendo en cuenta su participación en el Producto Interno Bruto (PIB), la generación de empleo y el volumen de bienes y servicios que circulan por estos canales.

    En Colombia, las exportaciones se registran estadísticamente cuando la Aduana ha realizado el cierre de la declaración de exportación, con base en estos elementos, la importancia de esta investigación consiste en presentar los códigos de exportaciones que han sido utilizados por el DANE y la DIAN para registrar los bienes que por metodología deben incluirse o excluirse de las estadísticas del comercio exterior de bienes, de acuerdo con las recomendaciones internacionales emitidas por la Comunidad Andina de Naciones y por la ONU.

    Analysis unit

    La declaración de exportación se constituye en la materia prima para la elaboración de las estadísticas de exportaciones, exceptuando las estadísticas de petróleo.

    Universo de estudio

    El universo de las exportaciones está constituido por los correspondientes exportadores de bienes del país.

    Kind of data

    Operación estadística basada en registros administrativos (adm)

    Mode of data collection

    Autodiligenciamiento de formulario electrónico vía página web (por selección; por ejemplo en encuestas por muestreo o censos)

    Research instrument

    El instrumento de recolección es la declaración de exportación (DEX), tanto la que graba la DIAN en su sistema, como las copias litográficas que recibe el DANE. La entidad que diseña este instrumento es la DIAN, el cuál se caracteriza por ser semiestructurado.

    Cleaning operations

    CONSOLIDACION DE ARCHIVOS

    El Equipo de Logística de autodiligenciamiento y registros se encarga de consolidar la información de todo el país, utilizando el lenguaje SAS para revisión, validación y corrección de inconsistencias. Para realizar esta operación se manejan los manuales para la consolidación y validación de archivos DIAN-DANE exportaciones-EXPO que se encuentran en el sistema documental de la investigación código LAR-EXPOMOT- 01.

    Después de aplicados los programas de validación de inconsistencias, el DANE produce mensualmente cuadros de salida con las principales variables registradas (Manual de archivos de salida E-110 exportaciones-EXPO código LAREXPO- MOT-02) . Esta información es analizada en comparación con la del mismo mes y año anterior, y en comparación con los meses anteriores, para encontrar si existen inconsistencias, si se ha aplicado la metodología propuesta y, en el contexto nacional, explicar la dinámica de las exportaciones en ese período.

    Sampling error estimates

    ANÁLISIS ESTADÍSTICO

    El DANE Central elabora una serie de cuadros que son de gran utilidad para identifi - car y analizar los fenómenos que afectan al comercio exterior del país. A partir de estos cuadros se pueden construir gráficos que ilustran mejor el fenomeno.

    Para el caso de las exportaciones es común presentar cuadros que muestren exportaciones tradicionales y no tradicionales, países de destino; departamentos de origen; aduanas de salida; productos y capítulos arancelarios que se exportan; uso de las exportaciones (demanda) mediante la clasifi cación COUDE; y sectores de los que provienen los bienes exportados (oferta), con base en la clasifi cación CIIU, entre otros.

    Cada cuadro que se elabora tiene el propósito de mostrar un fenómeno determinado, por ejemplo, cuando para el caso de las exportaciones colombianas se discrimina entre tradicionales y no tradicionales, se intenta así, hacer notar la importancia que reviste para el análisis, el hecho de tener en cuenta que un pequeño grupo de cuatro productos infl uye notablemente en el comportamiento general de las exportaciones. Asimismo, los cuadros de países de destino de las exportaciones, permiten identifi car cuáles países son importantes en las relaciones comerciales del país.

    En particular se analizan los comportamientos de:

    • Comportamiento del valor total FOB y toneladas netas de las exportaciones.

    • El valor FOB toneladas netas de las exportaciones por países de destino y sus variaciones porcentuales.

    • Exportaciones según aduanas del país y sus variaciones porcentuales.

    • Valor y cantidad neta según principales productos de exportación.

    • Cantidad neta y valor de los principales productos exportados según principales países de destino.

    • Valor y cantidad neta de las exportaciones según principales aduanas.

    • Valor y cantidad neta de las exportaciones según principales capítulos del arancel colombiano correspondiente.

    • Comportamiento valor FOB y toneladas exportadas según clasificación CIIU Rev.3

    • Valor de las exportaciones según departamento de origen.

    Para realizar un análisis completo no basta con evaluar los valores absolutos de las variables que se analizan, para este caso particular, las exportaciones. Es indispensable recurrir a herramientas que muestren evolución y proporciones. Es así como en todo análisis se deben tener en cuenta las variaciones, las participaciones y las contribuciones porcentuales.

    Es importante contrastar los datos que se estén obteniendo con la realidad económica y de los mercados internacionales.

    De esta forma, se pueden detectar errores en la manipulación de las cifras o se pueden descubrir fenómenos que deben ser cuidadosamente explicados con argumentos para el caso particular. Por ejemplo, si ante un incremento en el precio internacional del café, se reduce el valor FOB de las exportaciones colombianas del grano, esto puede ser un indicador de posibles errores en las estadísticas, a menos que sea posible explicar el fenómeno haciendo referencia a una sequía o plaga que haya arruinado la cosecha y, por tanto, haya afectado negativamente la exportación.

    Dentro del análisis de la información estadística de exportaciones, se hace especial énfasis en lo siguiente:

    • Comportamiento general de las exportaciones.

    • Resultados generales.

    • Exportaciones totales según países de destino.

    • Exportaciones totales destinadas a la Comunidad Andina.

    • Exportaciones tradicionales.

    • Exportaciones tradicionales según país de destino.

    • Exportaciones tradicionales según aduanas del país.

    • Exportaciones no tradicionales.

    • Exportaciones no tradicionales según CIIU Rev. 3.

    • Exportaciones no tradicionales según país de destino.

    • Exportaciones no tradicionales según aduanas del país.

    • Exportaciones no tradicionales según departamentos de origen.

    • Exportaciones según fechas de embarque.

    • Grado tecnológico de las exportaciones.

    Data appraisal

    INDICADOR DE CALIDAD

    Este se basa en la revisión que debe realizar el coordinador o responsable directo de la investigación de exportaciones en la Dirección Territorial, contrastando la información consignada en el DEX y la información que es almacenada en medio magnético con el aplicativo.

    Para llevar a cabo el control de calidad del proceso y obtener un indicador de calidad, se diseñó un módulo en el aplicativo de captura, con el fin de que el coordinador revise la muestra que genera el módulo del indicador de calidad en el aplicativo, la cual es determinada aleatoriamente.

    Esta muestra corresponde al 10% del material trabajado en la investigación, y asimismo equivale al 10% del trabajo desarrollado por cada uno de los críticos-grabadores.

  6. Not seeing a result you expected?
    Learn how you can add new datasets to our index.

Share
FacebookFacebook
TwitterTwitter
Email
Click to copy link
Link copied
Close
Cite
果丹皮 (2022). Data Expo 2009: Airline On Time Data [Dataset]. https://www.kaggle.com/datasets/wenxingdi/data-expo-2009-airline-on-time-data
Organization logo

Data Expo 2009: Airline On Time Data

Airline On-Time Performance Datasets

Explore at:
16 scholarly articles cite this dataset (View in Google Scholar)
CroissantCroissant is a format for machine-learning datasets. Learn more about this at mlcommons.org/croissant.
Dataset updated
Mar 20, 2022
Dataset provided by
Kagglehttp://kaggle.com/
Authors
果丹皮
License

https://creativecommons.org/publicdomain/zero/1.0/https://creativecommons.org/publicdomain/zero/1.0/

Description

Have you ever been stuck in an airport because your flight was delayed or cancelled and wondered if you could have predicted it if you'd had more data? This is your chance to find out.

The 2009 ASA Statistical Computing and Graphics Data Expo consisted of flight arrival and departure details for all commercial flights on major carriers within the USA, from October 1987 to April 2008. This is a large dataset containing nearly 120 million records in total.

The aim of the data expo is to provide a graphical summary of important features of the data set. This is intentionally vague in order to allow different entries to focus on different aspects of the data, but here are a few ideas to get you started: •When is the best time of day, day of the week, and time of year to fly to minimise delays? •Do older planes suffer more delays? •How well does weather predict plane delays? •How does the number of people flying between different locations change over time? •Can you detect cascading failures as delays in one airport create delays in others? Are there critical links in the system? •Use the available variables to construct a model that predicts delays.

Search
Clear search
Close search
Google apps
Main menu