Blog de Eduardo: El Papel de un Data Scientist Requiere de un Análisis Predictivo, Dice un Experto

domingo, 24 de febrero de 2013

El Papel de un Data Scientist Requiere de un Análisis Predictivo, Dice un Experto

Mad scientist caricature 2
Mike Gualtieri de Forrester tiene un punto de vista sobre el papel de un Data Scientist, el título de trabajo algo vago y discutido en la corte de las tiendas de informáticos de punta, campus y salas de juntas corporativas. En su opinión, los Data Scientists verdaderos son como otros científicos - formulan hipótesis, y luego las ponen a prueba. A pesar de que los demás pueden diferir, admitió.

"Existen diferentes definiciones por ahí. Algunas personas piensan que un científico de datos (Data Scientist) es una persona que gestiona, recauda y almacena datos. Eso está más en el campo científico de la computación que en el campo del analista", dijo Gualtieri, analista que cubre temas de análisis predictivo de Forrester Research Inc. en Cambridge, Mass. Mientras él pone énfasis en la necesidad de encontrar gente que sabe cómo recoger la información correcta, la definición de un científico de datos es tal vez más estrecho que los más prevalentes. Forrester Research Inc. en Cambridge, Mass. Si bien se pone énfasis en la necesidad de encontrar gente que sabe cómo recoger la información correcta, su definición de un científico de datos es tal vez más estrecho que los más prevalentes.

Mike Gualtieri, Forrester
"Mucha gente piensa que un científico de datos es alguien que puede hacer Hadoop (Hadoop es libre, basado en Java Framework de programación que soporta el procesamiento de grandes conjuntos de datos en un entorno de computación distribuida. Es parte del proyecto Apache patrocinado por la Fundación de Software Apache). Pero hay otra definición que me suscribo un poco más. Eso es, por un científico de datos como un científico ", continuó. "El científico determina los datos para trabajar. Si alguien no está haciendo el análisis, la búsqueda de los algoritmos y la prueba de ellos, entonces no es un Data Scientist".

Comprender el papel del científico de datos es importante, pero es sólo uno de los elementos clave de los datos que los gerentes deben tener en cuenta al planificar un programa para sacar provecho del análisis predictivo, la tecnología subyacente a la creciente demanda de datos científicos. Los modernos análisis predictivos son, junto con grandes cantidades de datos variados, lo que permite a las empresas reducir los riesgos y crear experiencias únicas de los clientes, Gualtieri, lo escribió en un informe reciente titulado The Forrester Wave: Big Data Solutions Predictive Analytics, Q1 2013.

Aunque el análisis predictivo basado en avanzados algoritmos de aprendizaje de máquina y otros que requieren nuevas herramientas y habilidades, ofrece valiosos beneficios más tradicionales de minería de datos para la inteligencia de negocios (Business Intelligence), dijo.

"El Business Intelligence antiguo en el estilo es realmente acerca de los informes -. Inteligentemente rebana y corta en diferentes formas que pueden ofrecer una visión, pero el análisis predictivo [es] muy diferente", dijo Gualtieri. "El análisis predictivo utiliza muchos tipos de algoritmos: algoritmos de regresión, redes neuronales, algoritmos diferentes de árboles, también los algoritmos que determinan lo que importan los datos y la probabilidad de un resultado."

Los algoritmos esencialmente hacen el trabajo, dijo. No hay precedente para este tipo de algoritmos en el trabajo de la inteligencia artificial que se remonta a la década de 1980, pero más fácil de disponibilidad de los datos, un mayor poder de cómputo y una mayor interoperabilidad con la herramienta de análisis predictivo que ofrece hoy un especial impulso.

Los administradores de datos pueden que necesiten confiar en sus datos científicos sobre algo de esto, y que necesitan para ganar la comprensión de los conceptos importantes (como la "previsibilidad" y la "probabilidad") para tomar decisiones inteligentes con el nuevo software. Tienen que establecer objetivos de negocio con el fin de maximizar el éxito de los programas de análisis predictivo, pero se encuentra tan difícil si ellos no entienden la previsibilidad, dijo.

"Es muy difícil para las empresas que no entienden la predicción. Mucha gente piensa que la predicción es algo absoluto, sino que el análisis predictivo no es binario", dijo Gualtieri. "El resultado de un modelo de predicción es siempre la probabilidad de que algo suceda".

Dijo que Netflix, sin duda, uno de los destacados entre las nuevas empresas basadas ​​en la Web, es un buen ejemplo del uso de este tipo de probabilidad. El servicio de películas en línea Netflix utiliza modelos de predicción, utilizando un motor de recomendación que sugiere películas. Como los usuarios saben que motor de recomendación puede ser un pronosticador sorprendente y preciso.


Image representing Netflix as depicted in Crun...
Cuando los clientes de Netflix se enfrentan a una decisión en este caso, se trata de una simple acción de aceptar o rechazar la recomendación. Para los empresarios que intentan, por ejemplo, elegir entre propuestas de mejora en la estrategia, es más difícil. "Los seres humanos tienen que determinar qué hacer con la información", dijo Gualtieri.

Si lo desea puede añadirme en Google+


Artículos relacionados:




Los  Mercados Online de Envato: ebooks, tutoriales, vídeos, cursos, temas para WordPress y App

Enhanced by Zemanta