Big Data - Definición, Relevancia, Ejemplos y Herramientas



Suprimiendo el sesgo en la contratación

big data en RRHH podrían hacer más equitativa la contratación y mejorar la diversidad reduciendo el sesgo, dice Zoe Jervier Hewitt de EQT Ventures a Protocol. Eso comienza incluso antes que los aspirantes sean entrevistados identificando qué criterios deben cumplir. Trato de hacer que el sistema de evaluación sea verdaderamente hermético, y encuentro que hay menos espacio a fin de que el sesgo no útil se introduzca en el proceso de esa forma, dice Jervier Hewitt. Agrega que una tarjeta de puntuación de la evaluación puede centrar la atención en la competencia de un aspirante y tener un efecto positivo en la diversidad de la cañería y la diversidad de las contrataciones.


Creando nuevas posiciones

RRHH asimismo podría introducir nuevas posiciones enfocadas a los datos, como el detective de datos, Richard Binder escribe en Benefits Pro. Pensando que los equipos de RRHH inevitablemente asumirán más funciones basadas en datos ... los estudiosos (del Centro de Conocimiento para el Futuro del Trabajo y el Lugar de Trabajo Futuro) se imaginan a un detective de datos de RRHH que sintetizaría flujos de datos como portales de beneficios y encuestas a empleados con la meta de solucionar inconvenientes empresariales, escribe Binder. El Detective podría ir desde una inmersión en big data a explicar los conocimientos de la gran imagen a los menos versados en datos, ayudando en último término a prosperar el desempeño de los empleados.


Big data: ¿Qué tan extenso debe ser tu lente? Depende de su empleo

La cantidad de datos que entran en su sistema puede marcar gran diferencia en su almacenaje, ancho de banda y presupuesto. Considere la posibilidad de reducir su apertura.

Con big data que llegan a las organizaciones de todo el mundo a razón de dos con cinco quintillones de bytes de datos día tras día, corresponde a las organizaciones determinar qué cantidad de estos big data es esencial y precisa, y qué porciones de el big data son excesivas y pueden eliminarse antes de que los datos lleguen a los sistemas corporativos. Si las compañías no lo hacen, el ancho de banda, el almacenaje y las capacidades de procesamiento se pueden sobrepasar, junto con los presupuestos.

Para cada operación y análisis que las compañías realizan con big data, la clave es acotar cada caso de empleo comercial por adelantado y predeterminar la cantidad de datos que verdaderamente precisará para abordar el caso comercial. Inevitablemente, va a haber algunos datos que simplemente no se precisan. Separar estos datos de su proceso de ingestión de datos es lo que llamo estrechar la apertura de la lente a través de la que los datos fluyen hacia su depósito de datos.

Acá hay 2 ejemplos divergentes de ajuste de la lente de datos:

IBM RoboRXN y la mecánica de la formulación molecular

Cuando IBM diseñó su proyecto RoboRXN, que recoge enormes cantidades de datos no editados de la comunidad mundial de código abierto y otros sobre posibles combinaciones moleculares para la formulación de productos, hubo que tomar decisiones sobre la cantidad de esos datos que era pertinente para el proyecto en el que estaban trabajando.

El proyecto RoboRXN se centró en el diseño de nuevas moléculas para soluciones farmacéuticas, como la vacuna COVID-19. Esto quería decir que no se necesitaban libros blancos, resultados de investigaciones estadísticas y otras fuentes de investigación que no tenían relación directa con el proyecto de formulación molecular en el que se trabajaba. Lo que IBM decidió hacer fue incorporar la inteligencia artificial (IA) al frente del proceso de ingestión de datos mientras que este enorme tesoro de datos no editados se estaba amontonando.

El algoritmo de IA planteó una pregunta importante: ¿Cada elemento de los datos entrantes contenía algo relevante para el enfoque del proyecto? Para las investigaciones que no estaban en absoluto relacionadas con el proyecto, o que sólo estaban relacionadas de forma distante y tangencial, la IA eliminó los datos, por lo que nunca fueron admitidos en el depósito de datos. En otras palabras, la apertura de la lente de datos al repositorio de datos del proyecto se estrechó, aceptando solo aquellos elementos de datos que eran relevantes para el proyecto. Como resultado, se redujo el almacenamiento y el procesamiento de datos, y asimismo el costo.

El SETI y la busca de vida extraterrestre

Fundado en mil novecientos ochenta y cuatro, la misión del Instituto SETI era buscar vida extraterrestre. Esto se hizo a través de la vigilancia de las señales de radio y las emisiones del espacio para determinar si había algún patrón repetitivo que pudiera representar una comunicación de otra manera de vida. Científicos y voluntarios participaron en la iniciativa del SETI, examinando meticulosamente montañas de señales de radio sin editar que fluían sin cesar.

En este esfuerzo, se pudieron hacer pocas suposiciones de antemano sobre los datos buenos frente a los malos, por el hecho de que absolutamente nadie estaba completamente seguro de lo que procuraba. En consecuencia, había pocas formas de estrechar la apertura de la lente de datos, que debía sostenerse abierta. Esto dio sitio a altos niveles de procesamiento, almacenamiento y trabajo manual.

Lo que el Instituto pudo hacer fue reducir los datos después de haberlos buscado en suma para encontrar señales potenciales que pudieran señalar formas de vida inteligentes. En este punto, sólo las señales con potencial de vida necesitaban ser almacenadas en bases de datos mucho más pequeñas.


Certificaciones en ciencias de la información para prosperar tu currículum y tu salario.

A fines de agosto, Glassdoor tenía más de cincuenta y tres ofertas de empleo que mencionaban el aprendizaje automático (ML) y veinte trabajos que incluían la ciencia de los datos con sueldos que iban de cincuenta a más de 180.000 dólares estadounidenses. Cada vez más empresas están haciendo del análisis de datos y del aprendizaje automático un factor central del desarrollo de nuevos productos y de las oportunidades de ingresos futuros.

Las grandes empresas de tecnología, así como las organizaciones tecnológicas independientes, ofrecen programas de capacitación para personas que son nuevas en la ciencia de los datos, así como para profesionales que desean dominar la tecnología más reciente. Cada programa de esta lista de los mejores cursos en línea para la ciencia de los datos ampliará su experiencia y agregará un valioso elemento de línea en forma de certificación de ciencia de los datos a su currículo.


Ingeniero profesional de aprendizaje automático de Google

Si puedes pasar este examen que está en versión beta, eres certificado por Google Cloud. Google recomienda que los examinandos tengan al menos 3 años de experiencia práctica con los productos y soluciones de Google Cloud.

El examen dura 4 horas y cuesta 120 dólares. Las seis secciones del examen cubren:

Enmarcar el problema del ML
Arquitectura de la solución ML
Preparación y procesamiento de datos
Desarrollo del modelo de ML
Automatización y orquestación del oleoducto de ML
Monitoreo, optimización y mantenimiento de la solución de ML




Certificaciones de científicos de datos del SAS

La Academia SAS para la Ciencia de los Datos ofrece tres credenciales de nivel profesional para los científicos de los datos:

La conservación de los datos
Análisis avanzados
La IA y el aprendizaje automático

SAS ofrece una prueba gratuita de treinta días a fin de que la gente pueda comprobar las herramientas, las oportunidades de aprendizaje práctico y los estudios de casos que son parte del programa de capacitación. También hay cursos gratis de aprendizaje electrónico sobre estadística y programación y administración de SAS.

El programa de conservación de datos está diseñado para personas que quieren cuantificar su experiencia con las herramientas y aplicaciones de administración de datos de SAS, así como otras herramientas para preparar los datos para el análisis estadístico. El programa incluye 4 cursos de capacitación y un bono para el examen de certificación, incluyendo:

Introducción a la conservación de datos
Herramientas y aplicaciones de gestión de datos del SAS
SAS y Hadoop
Herramientas y aplicaciones avanzadas de gestión de datos del SAS

Ya antes de anotarse en este curso, las personas deben tener experiencia con los fundamentos de la programación SAS, las técnicas de manipulación de datos y el procesamiento SQL. SAS ofrece clases de preparación para el examen en el programa Profesional de Curado de Datos.

El programa profesional de análisis avanzado incluye nueve cursos on-line, doce meses de acceso a la capacitación, cien horas de acceso al software de nube, y 3 vales de examen. Los cursos incluyen:

Analítica aplicada usando SAS Enterprise Miner
Modelado de la red neuronal
Modelización predictiva mediante regresión logística
Técnicas de minería de datos
Modelos de código abierto
Analítica de texto usando SAS Text Miner
Esenciales para el modelado de series temporales
La experimentación en la ciencia de los datos
Conceptos de optimización para la ciencia de los datos

SAS aconseja que los estudiantes tengan cuando menos seis meses de experiencia en programación y en el uso de estadísticas en un ambiente empresarial.

El programa profesional de aprendizaje de la IA y la máquina incluye cinco cursos on-line, setenta horas de acceso al software de la nube y tres vales de examen. SAS aconseja a las personas interesadas en este programa que tengan experiencia en programación, SAS Viya, modelos de regresión y modelos de redes neuronales. Los cursos son:

Aprendizaje automático con SAS Viya
Análisis de texto visual de SAS en SAS Viya
Aprendizaje profundo usando el software SAS
Pronóstico con Model Studio en SAS Viya
Conceptos de optimización para la ciencia de los datos y la IA

Cada programa cuesta mil doscientos noventa y cinco dólares americanos por año y requiere pasar varios exámenes para conseguir cada certificación. SAS ofrece una mezcla de lee esto clases de preparación de exámenes gratis y pagadas.

Los exámenes de certificación de SAS se pueden tomar desde casa a través de los exámenes supervisados en línea de OnVUE.

Leave a Reply

Your email address will not be published. Required fields are marked *