¿Cuánto es demasiada información de manera que sea elegible para ser procesada y analizada utilizando Big Data?
Gigabyte = 109 = 1,000,000,000
Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000
En muchas universidades se esta empezando a implantar en la carrera de tecnología informática la asignatura de Big Data, para que ya los futuros graduados puedan salir y dominar con gran precision este tema. A demás es muy importante saber como manejarlo, porque estamos moviendo una gran cantidad de datos todos los días, y como se pierdan puede originar grandes problemas para muchas personas.Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000
-¿De dónde proviene toda esa información?
Esta contribución a la acumulación masiva de datos la podemos encontrar en diversas industrias, las compañías mantienen grandes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores, etc., de la misma manera sucede con el sector público. En muchos países se administran enormes bases de datos que contienen datos de censo de población, registros médicos, impuestos, etc., y si a todo esto le añadimos transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales, ubicación geográfica mediante coordenadas GPS, en otras palabras, todas aquellas actividades que la mayoría de nosotros realizamos varias veces al día con nuestros "smartphones", estamos hablando de que se generan alrededor de 2.5 quintillones de bytes diariamente en el mundo.
-¿Por que es tan innovator big data?
lo que diferencia big data de otras aplicaciones de análisis son las tres V´s del Big Data: Volumen, Variedad y Velocidad (3Vs). Sin embargo, en base a la experiencia adquirida por las empresas pioneras en esta aventura, se ha ampliado la definición original, añadiendo nuevas características como son la Veracidad y Valor del dato (5Vs)
-Hablamos de Big Data cuando los volúmenes superan la capacidad del software habitual para ser manejados y gestionados.
-En el concepto de variedad nos referimos a la inclusión de otros tipos de fuentes de datos diferentes a las que se utilizan de forma tradicional.
-El concepto de velocidad se refiere a la rapidez con que los datos se reciben, se procesan y se toman decisiones a partir de ellos.
-La veracidad es la confianza de los datos.
- Por ultimo esta el valor. La importancia del dato para el negocio, saber que datos son los que se deben analizar, es fundamental.