A. Vergara López, M. Ayestaran ArregI

Eustat es muy consciente de que, en la estadística oficial, el “Big Data” es una ventana de nuevas fuentes de información con múltiples aplicaciones. La calidad en las estadísticas oficiales y simplificar las encuestas demandadas son dos focos importantes de mejora que pueden conseguirse mediante proyectos de “scrapeo” e inteligencia artificial.
Durante estos últimos años Eustat ha estado trabajando en diferentes proyectos de “Big Data”, entre los que destacan:
• “Scrapeo” de precios de hoteles en Booking.
• Encontrar URLs de las empresas de la Comunidad Autónoma del País Vasco.
• Detección de redes sociales en las páginas web.
• Detección de la utilización de “e-commerce” por las empresas.
• Prototipos para conocer las tecnologías utilizadas en las páginas web.
• Detección del código de actividad “CNAE” a través de “Text Minning”.
En esta ponencia explicaremos los procesos utilizados en algunos de nuestros proyectos.

Keywords: BigData, Scrapeo, BeatifullSoup, Selenium, Phyton, R, Java

Scheduled

Public Statistics
November 9, 2023  11:40 AM
CC1: Audience


Other papers in the same session


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.