La extracción, carga y transformación (ELT) es la técnica de extraer datos sin procesar del origen y almacenarlos en el almacén de datos del servidor de destino y prepararlos para los usuarios finales.
ELT consta de 3 operaciones diferentes realizadas en los datos:
1) Extraer: La extracción de datos es la técnica de identificación de datos de una o más fuentes. Las fuentes pueden ser bases de datos, archivos, ERP, CRM o cualquier otra fuente de datos útil.
2) Carga: La carga es el proceso de almacenar los datos sin procesar extraídos en el almacén de datos.
3) Transformar: La transformación de datos es el proceso en el que la fuente de datos sin procesar se transforma al formato de destino requerido para el análisis.
Los datos de las fuentes se extraen y almacenan en el almacén de datos. La información completa no se transforma, pero solo la transformación requerida se realiza cuando es necesario. Los datos sin procesar se pueden recuperar del almacén en cualquier momento cuando sea necesario. Los datos transformados según sea necesario se envían para su análisis. Cuando se usa ELT, se mueve todo el conjunto de datos tal como existe en los sistemas de origen al destino. Esto significa que tiene los datos sin procesar a su disposición en el almacén de datos, en contraste con el enfoque ETL.
ETL es la técnica tradicional de extraer datos sin procesar, transformarlos para los usuarios según sea necesario y almacenarlos en almacenes de datos. El ELT se desarrolló más tarde, teniendo ETL como base. Las tres operaciones que ocurren en ETL y ELT son las mismas, excepto que su orden de procesamiento es ligeramente variado. Este cambio de secuencia se realizó para superar algunos inconvenientes.
1) Extraer: Es el proceso de extraer datos sin procesar de todas las fuentes de datos disponibles, como bases de datos, archivos, ERP, CRM o cualquier otro.
2) Transformar: Los datos extraídos se transforman inmediatamente según lo requiera el usuario.
3) Carga: Los datos transformados se cargan en el almacén de datos desde donde los usuarios pueden acceder a ellos.
Los datos recopilados de las fuentes se almacenan directamente en el área de preparación. Las transformaciones requeridas se realizan en los datos en el área de ensayo. Una vez que los datos se transforman, los datos resultantes se almacenan en el almacén de datos. El principal inconveniente de la arquitectura ETL es que una vez que los datos transformados se almacenan en el almacén, no pueden modificarse nuevamente, mientras que en ELT, una copia de los datos sin procesar siempre está disponible en el almacén y solo los datos necesarios se transforman cuando es necesario.