Para la recolección de la información se usó la metodología de web-scraping. Esta consiste en examinar las propiedades del código bajo el que se muestran las páginas web en los navegadores y recoger la información necesaria conforme a los factores de identificación que se le da a la programación. Los análisis económicos y ejercicios econométricos con este género de datos se hacen poco a poco más frecuentes. Con la aplicación de éste género de metodologías, se puede aprovechar la estructura estática de la programación de las webs y las características del lenguaje HTML, aprovechando su estructura basada en tags, para conseguir la información9.
Una vez obtenido el resultado de clasificación, por medio del web service, se efectuó un proceso de revisión manual para la identificación de patrones que claramente dicho servicio no clasificó apropiadamente, dada la propia naturaleza informal del lenguaje colombiano, como por servirnos de un ejemplo el caso del «todero», «islero», «oficiales de construcción», entre otros, a los que se les aplicó el análisis de patrones de palabras, tanto del título de la plaza libre como la descripción, para poder asignar una clasificación acorde al requerimiento del empresario. NET a la clasificación CIUO ocho de la OIT para ejercicios de comparación con las estadísticas nacionales e internacionales. De esta manera, se partió de una información existente mas desordenada y se construyó una base de datos con seiscientos cincuenta y cuatro trescientos diez vacantes (anuncios) que corresponden a dos 201 479 puestos para dos mil catorce con las variables más relevantes (ver anejo 1), para su análisis estadístico.
If you cherished this article and you also would like to collect more info about http://www.youtube.com/watch?v=_WIqCr1z8Hg; Ongoing, kindly visit our own page.