Archivo de la etiqueta: Big Data

Hadoop, el motor que facilita la gestión del Big Data

A pesar del enorme potencial de los grandes datos, la gestión de las tremendas cantidades de información que acumulan las empresas puede resultar un difícil reto que, sin embargo, tarde o temprano hay que afrontar si queremos aprovechar sus importantes ventajas.

Acercarse a las tecnologías que permiten el almacenamiento y procesamiento de datos diversos a un bajo coste significa, inevitablemente, conocer el ecosistema Hadoop, su principal exponente, en el que nos introduce desde un enfoque técnico sencillo la guía "Qué significa Hadoop en el mundo del Big Data", creada por PowerData.

La Guía nos enseña el abc de Hadoop, los conocimientos imprescindibles para entenderlo de una vez por todas, con el objetivo de entender su funcionamiento y posibilidades para resolver los desafíos que Big Data plantea.  

Gracias a su tono ameno y a una exposición clara de los pormenores de HDFS y MapReduce, su estructura, fases y principales características, el ebook aborda sin complicación alguna tanto el aspecto teórico como el práctico, ayudándonos también a conocer qué pasos hemos de dar para implementarlo en un entorno real.

Como manual, el lector agradecerá su lenguaje sencillo y directo y su enfoque práctico, si bien en su conjunto esa accesibilidad podría resulta en cierto modo obvia para los ya iniciados o expertos en el tema. No en vano, este ebook descargable gratuitamente desde aquí, está concebido para servir de ayuda introductoria.

Su mismo enfoque práctico implica desde un repaso de su arquitectura básica, características de HDFS y fases de MapReduce hasta un acercamiento al rico ecosistema Hadoop como solución a la medida en función de las necesidades que cada etapa implica.

Además de contextualizar el concepto y la revolucionaria utilidad de Hadoop en el universo de Big Data, esta guía gratuita proporciona la información necesaria para completar las fases de Big Data a partir de las soluciones que brinda Hadoop, entendido como un revolucionario sistema de archivos distribuidos que dispone de un rico ecosistema.  

El ebook nos permitirá descubrir qué complementos del ecosistema Hadoop dan solución a las necesidades que cada etapa implica, el procedimiento de la extracción y limpieza de los grandes volúmenes de datos, su estructuración y análisis de Big Data, incluyendo el modelado de datos y la interpretación de grandes datos.

Su brevedad, visión global y estilo didáctico hacen de este ebook un interesante manual de gran ayuda a la hora de conocer los entresijos de esta tecnología opensource, de enorme protagonismo como sistema de procesamiento que permite extraer valor a partir del análisis de ingentes cantidades de información procedentes de distintas fuentes, generadas por los clientes o por el Internet de las cosas. 

Puesto que, hoy por hoy, Hadoop no tiene sustituto para sacar partido a Big Data, conocer sus aspectos básicos es fundamental, y el ebook nos ayuda a hacerlo desde cero. Su verdadera utilidad no sería otra que animarnos a implementarlo para acercarnos al objetivo último de toda empresa: obtener conocimiento a partir de datos estructurados y no estructurados con el fin de posicionarse con ventaja en el actual panorama competitivo.

Big Data Hadoop (1)

Fuente imagen: Stuart Miles / FreeDigitalPhotos.net

4 programas de Text Analytics para español

En un artículo previo sobre Text Analytics decíamos que hace años que todos sabemos o intuimos la importancia y el valor del análisis de textos masivos. La primera dificultad que tuvimos que superar fue la capacidad de almacenamiento de inmensas cantidades de texto y la segunda conseguir procesar dicha información con cierta rapidez. Hoy presento 4 programas de Text Analytics para español que nos permiten procesar dicha información.

SAS Text Miner

Es un módulo que incorpora funciones de lingüística al programa de minería de datos SAS Enterpise Miner, de forma que se puede complementar el análisis de datos estructurados con análisis de datos no estructurados. Es compatible con español.

La empresa ofrece un extenso programa de formación que incluye capacitación vía web mediante cursos Live Web, cursos e-learning y tutoriales gratuitos. Todo ello en inglés.

Para hispanohablantes, cuentan con sedes en España, Argentina, Chile, Colombia, México, Perú y Venezuela.

Su web es: http://www.sas.com/en_us/home.html

 

SPSS Text Analyticis for surveys

El software de IBM SPSS Text Analytics for Surveys permite transformar texto de encuestas no estructurado en datos cuantitativos y extraer conocimiento mediante análisis de los sentimientos. La solución utiliza tecnologías de procesamiento del lenguaje natural (NLP) diseñadas específicamente para la redacción del texto de las encuestas.

SPSS Text Analytics for Surveys categoriza respuestas e integra los resultados con otros datos de la encuesta para obtener mejores conocimientos y análisis estadístico.

Ofrecen varias modalidades de compra con un precio que ronda los 7.000€

Más información en: http://www-03.ibm.com/software/products/es/spss-text-analytics-surveys

 

WordStat

Es un software de análisis de texto que permite la integración con dos software complementarios: Simstat para análisis de datos estadísticos y QDA Miner para análisis de datos cualitativos. Esta integración permite analizar el texto y relacionar su contenido a información estructurada, incluyendo datos categóricos y numéricos.

Permite el análisis desde varias fuentes de información como pueden ser transcripciones de entrevistas y grupos focales, respuestas abiertas, sitios web, reportes incidentales, quejas de clientes o mensajes, etc.

El precio de Wordstat 6 es de 2995$

Más información en http://provalisresearch.com/es/productos/software-de-analisis-de-contenido/

 

Textalytics

Software en la nube de análisis de datos no estructurados que se puede nutrir de texto procedente de medios sociales, noticias, contratos, etc.

Su tarificación va por planes, incluyendo uno gratuito.

Su web en: https://textalytics.com/inicio

 

¿Has manejado programas de Text analytics? ¿Quieres compartir tu experiencia? ¡Anímate a publicar un post!

TEXT ANALYTICS

Más allá de generar nubes de palabras, o realizar sentiment analysis, cuando hablamos de Text Analytics, hablamos de análisis de Big Data aplicado a texto no estructurado o lenguaje natural. La minería de textos implica la utilización de conocimientos procedentes de varias disciplinas, tales como la estadística, la inteligencia artificial, la computación gráfica, las bases de datos y el procesamiento masivo. Pero ¿en qué consiste?

Sigue leyendo TEXT ANALYTICS

¿Es ético el estudio de Facebook sobre las emociones?

En estos días se han publicado los resultados de un estudio llevado a cabo por Facebook en el que querían determinar si existe contagio emocional a través de las publicaciones que los usuarios realizan en las redes sociales.

La cuestión ha saltado a los medios de comunicación masiva poniendo claramente en entredicho la ética de dicha investigación.

Pero ¿Faltó la investigación realmente a los códigos de comportamiento ético que toda investigación social debe respetar?

Sigue leyendo ¿Es ético el estudio de Facebook sobre las emociones?

Google compra Rangespan, la empresa que “adivina” los productos que tus clientes comprarán

Rangespan fue creada para que los puntos de venta ajustaran su oferta comercial a la demanda potencial de sus clientes. Su eslogan DATA INSIGHTS & RETAIL GROWTH. ¿Qué ofrece esta empresa para haberse convertido en algo interesante para Google?

Sigue leyendo Google compra Rangespan, la empresa que “adivina” los productos que tus clientes comprarán

R para encuestas: una introducción

JoseI.Casas_foto 

El software para el análisis de encuestas tradicionalmente se ha repartido entre aplicaciones propietarias y de más bien elevado coste (tipo SPSS©, SAS©, etc.) o aplicaciones casi de tipo artesanal, de escaso respaldo y corto alcance.

Pero un reciente lenguaje de análisis estadístico llamado R, está experimentando un crecimiento exponencial tanto en sus capacidades como en su uso y popularidad.

 

Sigue leyendo R para encuestas: una introducción