Big Data en la Estadística Pública: retos ante los primeros pasos.

  1. David Salgado 1
  1. 1 Instituto Nacional de Estadística y Geografía
    info

    Instituto Nacional de Estadística y Geografía

    Aguascalientes, México

    ROR https://ror.org/03647wj34

Revista:
Economía industrial

ISSN: 0422-2784

Año de publicación: 2017

Título del ejemplar: Nuevas tecnologías digitales

Número: 405

Páginas: 121-129

Tipo: Artículo

Otras publicaciones en: Economía industrial

Resumen

Este artículo discute los retos fundamentales encontrados en los primeros pasos para integrar el Big Data en la producción estadística oficial, que engloban básicamente el acceso institucional sostenido, el cambio radical de metodología estadística involucrado, los desafíos tecnológicos y especialmente, la revisión del marco de calidad que asegure los mismos estándares oficiales de la producción con estas fuentes. Todo ello conlleva cambios tanto dentro de los sistemas estadísticos públicos (por ejemplo, en el perfil profesional del estadístico oficial) como en el sector público en en general (por ejemplo, la relación entre los proveedores de datos y las Administraciones Públicas)

Referencias bibliográficas

  • AEPD (2017). Agencia Española de Protección de Datos. https://www.agpd.es.
  • BETHLEHEM, J. (2009). Applied Survey Methods A Statistical Perspective. Amsterdam: Wiley.
  • BIEMER, P. (2010). «Total survey error: design, implementation, and evaluation». Public Opinion Quaterly, 74, 817-848.
  • BUTLER, D. (2013). «When Google got flu wrong». Nature, 494, 155-156.
  • CASSEL, C.-M., SÄRNDAL, C., and WRETMAN, J. (1977). Foundation of inference in survey sampling. New York: Wiley.
  • COMUNIDAD EUROPEA (2002). Versión consolidada del Tratado Constitutivo de la Comunidad Europea. Diario Oficial de las Comunidades Europeas C325/33-184.
  • CONSTEN, A. (2017). ESSnet Pilot on AIS Data. Dissemination Workshop of the ESSnet on Big Data. Sofia, 23-24 February, 2017. https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/images/7/77/Presentation_ WP4_20170223-24_Sofia_AIS_data.pdf.
  • ESS TASK FORCE ON BIG DATA (2017). Results from the analysis project on legal issues related to the use of Big Data. Doc.DDG.TF.BD 2017 04 27-28-4-legal issues. Internal document.
  • EUROPEAN COMMISSION (2017). Communication from the Commission to the European Parliament, the Council, the European Economic and Social Committee and the Committee of the Regions on the Mid-Term Review on the implementation of the Digital Market Strategy. A connected Digital Single Market for All. COM(2017) 228 final.
  • EUROPEAN STATISTICAL SYSTEM (2011). European Statistics Code of Practice. http://ec.europa.eu/eurostat/documents/ 3859598/5921861/KS-32-11-955-EN.PDF/5fa1ebc6-90bb43fa-888f-dde032471e15.
  • EUROPEAN STATISTICAL SYSTEM (2012). ESS Quality Assurance Framework v1.2. http://ec.europa.eu/eurostat/ documents/64157/4392716/qaf_2012-en.pdf/8bcff303-68da43d9-aa7d-325a5bf7fb42.
  • EUROSTAT (2015). Big Data. https://ec.europa.eu/eurostat/ cros/content/big-data_en.
  • KLEIN, T. and VERHULST, S. (2017). «Access to new data sources for statistics: business models and incentives for the corporate sector». OECD Statistics Working Papers (Working Paper No. 82), 1-38.
  • KRUSKAL, W. and MOSTELLER, F. (1979a). Representative sampling, I: Non-scientific literature. International Statistical Review, 47, 13-24.
  • KRUSKAL, W. and MOSTELLER, F. (1979b). «Representative sampling, II: scientific literature, excluding statistics». International Statistical Review, 47, 111-127.
  • KRUSKAL, W. and MOSTELLER, F. (1979c). «Representative sampling, III: the current statistical literature». International Statistical Review, 47, 245-265.
  • KRUSKAL, W. and MOSTELLER, F. (1980). Representative sampling, IV: the history of the concept in Statistics, 1895-1939». International Statistical Review, 48, 169-195.
  • KUHN, T. (1957). The Copernican revolution. Boston: Harvard University Press.
  • LANEY, D. (2001). 3D Data management: controlling data volume, velocity y variety. META Group. http://blogs.gartner.com/ doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-y-Variety.pdf
  • LESSLER, J. and KALSBEEK, W. (1992). Nonsampling error in surveys. New York: Wiley.
  • NORMANDEAU, K. (2013). Beyond Volume, Variety and Velocity is the Issue of Big Data Veracity. insideBigData, 12 September, 2013. http://insidebigdata.com/2013/09/12/beyond-volume-variety-velocity-issue-big-data-veracity/.
  • OLSON, D., KONTY, K., PALADINI, M., VIBOUD, C., and SIMONSEN, L. (2013). «Reassessing Google flu trends data for detection of seasonal and pandemic influenza: a comparative epidemiological study at three geographic scales». PLOS Computational Biology, 9, 156-170.
  • ONU (2014). Principios Fundamentales de las Estadísticas Oficiales de Naciones Unidas. New York: Naciones Unidas. https:// unstats.un.org/unsd/dnss/gp/FP-New-S.pdf.
  • SALGADO, D., ALEXYRU, C., DEBUSSCHERE, M., DUPONT, F., PIELA, P., and RADINI, R. (2016). Current status of access to mobile phone data in the ESS. ESSnet on Big Data WP5 Deliverable 1.1. https://webgate.ec.europa.eu/fpfis/ mwikis/essnetbigdata/images/6/65/WP5_Deliverable_1.1.pdf.
  • SALGADO, D., ALEXYRU, C., OANCEA, B., DEBUSSCHERE, M., DUPONT, F., PIELA, P., WILLIAMS, S. (2017). Guidelines for the access to mobile phone data within the ESS. ESSnet on Big Data WP5 Deliverable 1.2. https://webgate.ec.europa.eu/fpfis/mwikis/ essnetbigdata/images/ 6/65/WP5.Deliverable_1.2.pdf
  • SCHOUTEN, B., COBBEN, F., and BETHLEHEM, J. (2009). «Indicators for the representativeness of survey response». Survey methodology, 35(1), 101-113.
  • SMITH, T. (1976). «The foundations of survey sampling: a review». Journal of the Royal Statistical Society A, 139, 183-204.
  • SMITH, T. (1994). «Sample surveys 1975-1990: An age of reconciliation?» International Statistical Review, 62, 5-19.
  • STARMANS, R. (2016). «The advent of data science: some considerations on the unreasonable effectiveness of data». En P. Bühlmann, P. Drineas, M. Kane, y M. van der Laan, Hybook of Big Data (págs. 3-20). Amsterdam: Chapman y Hall/CRC Press.
  • THE ECONOMIST. (2010). The data deluge. http://www.economist.com/node/15579717.
  • UNECE (2011). Modernization of official statistics. https://www. unece.org/stats/mos.html.
  • UNITED NATIONS GLOBAL WORKING GROUP ON BIG DATA (2016). Recommendations for access to data from private organizations for Official Statistics. Dublin: United Nations.
  • WIKIPEDIA (2017A). Virtualization. https://en.wikipedia.org/wiki/ Virtualization.
  • WIKIPEDIA (2017B). Cloud Computing. https://en.wikipedia. org/wiki/Cloud_computing.
  • YATES, F. (1949). Sampling methods for censuses and surveys. London: Charles Griffins.