¿Por qué usar una lavadora frente a lavar la ropa a mano? ¿por qué ir en un coche en vez de un carro con caballos? ¿por qué usar un smartphone moderno en vez de un teléfono antiguo? ¿por qué usar un ordenador frente a escribir a máquina?
Las respuestas parecen obvias. Pero también es obvio que Excel es extremadamente manual, tedioso y poco útil para analizar datos y sigues utilizando ¿verdad? Adéntrate con nosotros en el día a día de un analista y descubre cómo cambia la forma en la que analiza y optimiza su tiempo, utilizando solo hojas de cálculo o una herramienta de análisis avanzados como Alteryx:
Tu “yo más iluso” comienza el día pensando “¿No pueden llevarse bien todas las fuentes de datos?”. Tu trabajo es cavar y encontrar pepitas de oro en esa vorágine de datos, y aunque parezca algo reconfortante, la verdad es que puede convertirse en el trabajo más frustrante del mundo. Comienzas abriendo conjuntos de datos. Y más conjuntos de datos. Cada conjunto puede proceder de una fuente o programa diferente, especialmente si los datos provienen de diferentes departamentos (si has logrado superar a los guardianes de cada uno de ellos). Aquí es donde empieza el lío. Aceptar datos en múltiples formatos no es particularmente fácil en hojas de cálculo. Para construir un conjunto de datos con el que puedas trabajar, tienes algunas manipulaciones que hacer.
Del mismo modo, mientras manipulas esos conjuntos de datos, te van surgiendo preocupaciones como: “¿Estoy agregando información duplicada o innecesaria? ¿Perderé algo entre archivos en diferentes formatos? ¿Tendré que omitir información importante porque no es compatible con mi conjunto de datos?” Los analistas en todas partes deben lidiar con silos de datos, donde la información está atrapada en formatos inutilizables y en departamentos aislados. Y sueñan con el nirvana de los datos: una normalización de datos fluida y sin complicaciones, donde todos los datos estén organizados lógica y consistentemente.
¿Y si este nirvana existiera de verdad?
Hay una manera más fácil de construir y normalizar un conjunto de datos, incluso si trabajas con formatos de archivos incompatibles, conexiones de bases de datos o almacenes de datos en la nube. De hecho, las posibilidades de tipos de datos que puedes incluir en tu trabajo son casi infinitas. Simplemente necesitas un punto de partida donde todos los formatos sean bienvenidos y ningún dato quede atrás. En Alteryx, ese punto de partida se llama tu lienzo. Es visual, es simple y puede cambiar tu vida. Solo arrastra y suelta una herramienta de entrada de datos en tu lienzo, encuentra el conjunto de datos que estás tratando de importar y selecciona. Si alguna vez perdiste la mayor parte de un día soleado intentando que tu Excel acepte una fuente de datos, te encantará la forma en que Alteryx hace las cosas. ¿Diferentes formatos o estructuras de archivos? Alteryx ni siquiera pestañeará. Puedes acceder a datos localmente desde Excel, Access, XML, SAS, SPSS o MapInfo, así como a datos almacenados en bases de datos o HDFS. Alteryx también tiene conectores directos a sistemas en la nube como Amazon S3, Twitter, Foursquare, Marketo, Salesforce y Microsoft SharePoint, así como otros entornos de Big Data como Amazon Redshift, Impala y Spark.
El trabajo mundano de limpiar datos es donde pasas la mayor parte de tu tiempo como analista. Pero cuando llegas a la parte más interesante, ya sabes, el "análisis", estás sin gasolina y sin tiempo. En las hojas de cálculo, la limpieza es un proceso altamente manual. El análisis, la creación de columnas, la eliminación de filas, la eliminación de espacios en blanco, y así sucesivamente, pueden llevarte muchísimo tiempo y agotarte por completo. Créenos, lo sabemos. Pero hay un problema más grande que considerar. Todo ese cortar y pegar y renombrar no solo lleva una cantidad loca de tiempo, sino que también es una invitación a cometer errores.
Errores de cálculo, errores mentales y registros duplicados en estas etapas iniciales pueden enviar tu análisis en la dirección incorrecta o incluso obligarte a empezar de nuevo. La integridad de los datos debería ser tu mayor preocupación en la etapa de limpieza. Quieres tener confianza en la precisión y consistencia de los datos, sin importar a dónde los muevas o cómo cambies su formato, y asegurarte de que su significado no se altere involuntariamente mientras los ordenas.
Reconsidera el Enfoque Manual
En lugar de una serie de clics que adormecen la mente y aplastan el alma, ¿qué tal si la limpieza de datos fuera una función amplia lograda por herramientas de alto nivel? ¿Y si en lugar de mil acciones, tomaras solo una o dos? Utilizar Alteryx cambiará drásticamente cuánto tiempo pasas limpiando datos. No vamos a mentir, es un gran avance. Puedes crear nuevas columnas, eliminar filas y columnas, y cambiar tipos de datos con un solo paso en Alteryx, un paso que se aplica instantáneamente a lo largo de todo tu conjunto de datos. También puedes dejar que Alteryx tome el control e interprete automáticamente tus datos, asignando tipos y tamaños apropiados para el contenido. Y el historial de lo que hiciste siempre está ahí, así que nunca más tendrás que empezar de nuevo si cometes un error. (En serio). Este enfoque sofisticado para la limpieza de datos prácticamente elimina los procesos manuales y los errores humanos, liberando tu tiempo para cosas más importantes.
Aquí es donde las cosas comienzan a ponerse interesantes, o aterradoras, dependiendo de cuán seguro te sientas al combinar y agregar datos de hojas de cálculo separadas. Unir conjuntos de datos siempre significa alterar tu material fuente. Si tienes suerte, pasas por esta etapa sin dañar accidentalmente tu conjunto de datos. Si no, vuelves al punto de partida. Al igual que con la mayoría de los pasos para procesar datos en hojas de cálculo, las acciones requeridas para unir conjuntos de datos son increíblemente tediosas. ¿Somos nosotros, o repetir "VLOOKUP" continuamente es una receta para la locura? El problema con mezclar datos de la manera antigua es que las hojas de cálculo no son agnósticas. Los programas de hojas de cálculo reconocen solo su formato preferido, y no pueden salir de ese formato sin una entrada directa tuya mediante herramientas manuales como VLOOKUP o INDEX MATCH.
Hay una Mejor Manera de Mezclar
¿Y si tu programa pudiera simplemente mezclar los datos por ti para que no tuvieras que perder tiempo preocupándote por el formato? ¿Y si pudiera llevar un registro de todo lo que se hizo para que siempre puedas retroceder y deshacer? Un conjunto de herramientas profundamente simple en Alteryx (Unión, Buscar y Reemplazar y Unir) te proporciona toda la funcionalidad de mezcla de tu anterior programa de hojas de cálculo pero con un nuevo conjunto brillante de capacidades creativas que ni siquiera sabías que necesitabas. Puedes rastrear y volver a rastrear tus pasos hasta cualquier punto en tu flujo de trabajo en cualquier momento, y seguirlos de vuelta a tu punto de partida si es necesario.
Combina múltiples hojas de cálculo basadas en el nombre del campo mientras mantienes la posición de cada columna. O cambia el orden de las columnas si lo deseas. Une dos flujos de datos con un campo común realizando un “Unir” interno o externo. De hecho, junta los datos de cualquier manera que desees. Al dejar que Alteryx haga la mayor parte del trabajo, puedes pasar directamente a explorar más profundamente tu conjunto de datos. En las hojas de cálculo, las probabilidades de error se disparan.
¿Alguna vez olvidaste un filtro? Lo entendemos. Para descubrir el significado más profundo de los datos, necesitas verlos a través de tus propios parámetros cuidadosamente elegidos. Para hacer esto en hojas de cálculo, filtras, ordenas y pivotas para transponer y reorganizar los datos exactamente como quieres. Esas no son tareas necesariamente difíciles, pero aún deben hacerse manualmente. Además, una vez que comienzas a rebanar y cortar, puede ser difícil recordar exactamente lo que hiciste. Puedes usar la función de rastrear dependientes para seguir tus acciones, pero nuevamente, esa herramienta es manual y propensa a errores.
El proceso de transformación de datos en hojas de cálculo puede ser frustrante y consumir mucho tiempo para ti personalmente, pero la preocupación más grande es que campos de datos ocultos y filtros olvidados pueden costarle a tu empresa mucho dinero. Cuando terminas un análisis, ¿qué tan seguro estás de que no se perdió nada en el camino? ¿Apostarías tu trabajo en eso?
El Siglo XXI está Llamando
Al realizar funciones comunes de transformación de datos con herramientas altamente inteligentes, puedes reducir errores, y el riesgo, a medida que avanzas en la parte más emocionante de tu trabajo. Las herramientas de Ordenar, Transponer y Tabular en Alteryx te permiten organizar y pivotar tus datos en muchas direcciones diferentes automáticamente, permitiéndote ver el panorama general rápidamente. Y al usar estas herramientas en flujos de trabajo, siempre puedes volver a tu punto de partida y tener en cuenta tus pasos. Poder explicar tu metodología y cambiar vistas sobre la marcha no tiene precio. ¿Cómo compararíamos transformar datos en hojas de cálculo con transformar datos en flujos de trabajo? No lo haríamos. Es como comparar un teléfono rotativo de los años 50 con un nuevo y brillante smartphone que puede hacer mil cosas diferentes. Cuando se trata de establecer una estrategia avanzada para la metodología de datos, los flujos de trabajo son la diferencia entre una organización aislada y una con una verdadera cultura de análisis.
¿Frustrado con las fórmulas? Es lógico. Vamos a hacer algunos cálculos, ¿de acuerdo? Las hojas de cálculo están diseñadas para calcular fórmulas lógicas mediante declaraciones IF, que son bastante fáciles de configurar. Pero aplicar esas fórmulas por todos lados es algo completamente diferente. Cuando aplicas fórmulas, retienes mucha información en tu memoria sobre lo que estás haciendo y cómo llegaste allí. Cortar y pegar fórmulas comienza a sentirse un poco dudoso. ¿Dónde pusiste ese conjunto de filas que pensaste que no querías, otra vez? ¿Aplicaste esa fórmula donde debía ir? Espera, ¿ocultaste algunas celdas? ¿Qué pasó con todo en tu portapapeles? ¿Era importante?
Mejor Configurar y Olvidar
Configurar una fórmula una vez, con una sola herramienta, y aplicarla exactamente donde la deseas, es una solución mucho mejor que aplicar manualmente fórmulas por todas partes e intentar recordar lo que hiciste. La Herramienta de Fórmulas en Alteryx es un procesador potente; con una sola acción, puedes agregar un campo a una tabla de entrada o crear o actualizar campos de datos según una expresión o una relación de datos. Si algo se agrega, resta o se modifica, tu flujo de trabajo muestra qué, cuándo y dónde, así que siempre hay una opción para retroceder y reconsiderar. En Alteryx, los datos, la lógica y la ejecución existen en capas separadas. Esto significa que puedes tomarte el tiempo para planificar tu lógica antes de ejecutarla, y ningún dato resultará dañado una vez que lo hagas. Si algo cambia o se añaden nuevos registros, tu lógica se aplicará automáticamente, para que puedas confiar en tus resultados. Otra preocupación eliminada de la lista. Es increíblemente liberador.
¿Escribes tan rápido como piensas? El poder descriptivo y predictivo de los datos radica en la agregación; es donde se revelan los secretos. Pero resumir datos en hojas de cálculo requiere el uso de tablas dinámicas, por lo que aún estás en modo de enfoque único mientras descubres ideas clave y entregas tus resultados. Ver datos a través de una única perspectiva compromete tu agilidad y precisión en la fase final de análisis y te impide poder responder a cada pregunta difícil que tu jefe imagina. Y luego está la dificultad técnica de trabajar con conjuntos de datos extremadamente grandes. A veces, tu sistema no puede manejar la carga cuando necesitas cambiar tus parámetros, cambiar posiciones o replantear tus suposiciones, y es ahí cuando la rueda giratoria de la muerte de la hoja de cálculo aparece en la pantalla.
El resumen manual de datos siempre estará limitado por la velocidad de tus dedos, las capacidades de tu solución de hojas de cálculo y la potencia de tu sistema informático. Y tu salida te permite ver solo una porción de resultados a la vez, no el pastel completo. Si eres impaciente con estas limitaciones cuando llegas a la cima de tu análisis, ¿quién te culparía? Cuando los pasos manuales del procesamiento de datos van más lentos que tus ondas cerebrales, puedes perder muchas ideas valiosas.
Libera tu Mente
Lo que necesitas es una poderosa herramienta de resumen que pueda ofrecer múltiples resultados y vistas automáticamente, permitiéndote explorar valores atípicos, encontrar patrones y hacer preguntas más profundas tan rápido como las puedas pensar. La Herramienta de Resumen en Alteryx procesa datos instantáneamente en cada paso de tu trayecto de datos para que puedas ver muchas vistas a la vez, acelerando tu tiempo de impacto. ¡Se acabó construir tablas dinámicas! Agrupa tus datos y realiza cualquier cantidad de cálculos en cualquier campo que desees, incluyendo funciones más avanzadas que no se encuentran en hojas de cálculo, como análisis financiero, numérico, espacial y de comportamiento.
Ahora, por fin, puedes entregar ideas profundas y matizadas, en las que confías, a tiempo y en el objetivo ¿seguirás utilizando Excel?