Cómo abrir archivos de texto y CSV realmente grandes


MS Excel puede mostrar 1.048.576 filas. Si bien esto puede parecer un número realmente grande en el uso normal, hay muchos escenarios en los que no es suficiente.

Ya sea que estés viendo archivos de registro o grandes conjuntos de datos, es fácil encontrar archivos CSV con millones de filas o archivos de texto enormes. Dado que Sobresalir no puede admitir archivos de este tamaño, ¿cómo se abren exactamente? Averigüemos.

¿Por qué los editores de texto normales no pueden abrir archivos realmente grandes?

Una computadora tiene gigabytes de almacenamiento, entonces, ¿por qué los editores de texto no pueden abrir archivos grandes?

Hay dos factores en juego aquí. Algunas aplicaciones tienen un límite codificado sobre la cantidad de datos que pueden mostrar. No importa cuánta memoria tenga tu PC, simplemente no la usarán.

El segundo problema es la RAM. Muchos editores de texto no tienen un límite estricto en el número de filas, pero no pueden mostrar archivos grandes debido a limitaciones de memoria. Cargan el archivo completo en la RAM del sistema, por lo que si esta memoria no es lo suficientemente grande, el proceso falla.

Método n.º 1: utilizar editores gratuitos

La mejor manera de ver archivos de texto extremadamente grandes es usar... un editor de texto. No cualquier editor de texto, sino las herramientas destinadas a escribir código. Estas aplicaciones normalmente pueden manejar archivos grandes sin problemas y son gratuitas.

Visor de archivos de texto grandes es probablemente la más sencilla de estas aplicaciones. Es realmente fácil de usar, funciona rápido y ocupa muy pocos recursos. ¿El único inconveniente? No puede editar los archivos. Pero si solo desea ver archivos CSV grandes, esta es sin duda la mejor herramienta para el trabajo.

Para editar archivos de texto grandes también, deberías probar Emacs. Creado originalmente para sistemas Unix, también funciona perfectamente en Windows y puede manejar archivos grandes. De manera similar, Neovim y Texto sublime son dos IDE livianos que se pueden usar para abrir archivos de texto CSV de tamaño gigabyte.

Si lo único que busca es buscar datos en archivos de registro grandes, entonces klogg es la herramienta para usted. Esta aplicación, una bifurcación de actualización del popular glogg, le permite realizar operaciones de búsqueda complejas a través de enormes archivos de texto con facilidad. Dado que los archivos de registro generados por computadora a menudo pueden tener millones de filas, klogg está diseñado para funcionar con esos tamaños de archivos sin problemas..

Método n.º 2: dividir en varias partes

El problema al intentar abrir archivos CSV grandes es que son demasiado grandes. Pero ¿qué pasaría si los dividieras en varios archivos más pequeños?

Esta es una solución popular, ya que generalmente no implica tener que aprender la interfaz de un nuevo editor de texto. En su lugar, puede utilizar uno de los muchos divisores CSV disponibles en línea para dividir el archivo grande en varios archivos fáciles de abrir. Luego se podrá acceder a cada uno de estos archivos normalmente.

Sin embargo, esta no es la mejor manera de hacerlo. Dividir un archivo grande a menudo puede provocar errores tipográficos extraños o archivos configurados incorrectamente. Además, abrir cada fragmento por separado evita que puedas filtrar todos los datos a la vez.

Método n.º 3: importar a una base de datos

Los archivos de texto y .csv que ocupan varios gigabytes suelen ser conjuntos de datos de gran tamaño. Entonces, ¿por qué no simplemente importarlos a una base de datos?

SQL es el lenguaje de marcado de bases de datos más común utilizado hoy en día. Hay muchas versiones de SQL en uso, pero el más fácil probablemente sea MySQL. Y por suerte, es posible convertir un archivo CSV en una tabla MySQL.

Este no es de ninguna manera el método más sencillo para trabajar con archivos CSV grandes, por lo que solo lo recomendamos si desea trabajar con grandes conjuntos de datos de forma regular. Si MySQL suena demasiado complicado, siempre puedes importar tus archivos .csv a Acceso MS.

Método n.º 4: analizar con bibliotecas de Python

Cuando trabajas con un archivo .csv con millones de filas de datos, obviamente no podrás entenderlo manualmente. Probablemente quieras filtrar los datos y ejecutar consultas específicas para comprender las tendencias.

Entonces, ¿por qué no escribir código Python hacer precisamente eso?

Una vez más, este no es el método más fácil de usar. Si bien Python no es el lenguaje de programación más difícil de aprender es codificación, por lo que puede que no sea el mejor enfoque para usted. Aún así, si tienes que analizar archivos CSV muy grandes a diario, es posible que desees automatizar la tarea con algo de código Python.

Método n.º 5: con herramientas premium

Los editores de texto que vimos en el primer método no eran herramientas dedicadas al procesamiento de CSV. Eran herramientas de uso general que también podían usarse para trabajar con archivos .csv de gran tamaño.

Pero ¿qué pasa con las aplicaciones especializadas? ¿No existen aplicaciones creadas para resolver este problema?.

En realidad, las hay. Explorador CSV, por ejemplo, se basa en el mismo proceso que describimos en los dos últimos métodos (base de datos SQL y código Python) para crear una aplicación capaz de ver y editar archivos CSV de cualquier tamaño. Puedes hacer todo lo que esperas de una herramienta de hoja de cálculo, como crear gráficos o filtrar los datos en CSV Explorer.

Otra opción es UltraEditar. A diferencia de la herramienta anterior, esta está pensada no sólo para archivos .csv sino para cualquier tipo de archivo de texto. Puede manejar fácilmente archivos de texto y CSV de hasta unos pocos gigabytes, con una interfaz similar a muchos de los editores gratuitos que analizamos anteriormente.

El único inconveniente de estas herramientas es que son aplicaciones premium, por lo que es necesario obtener una licencia paga para poder utilizarlas. Siempre puedes probar sus versiones de prueba gratuitas para comprobar sus funciones, o si solo tienes un uso único.

¿Cuál es la mejor manera de abrir archivos de texto grandes y archivos CSV?

En esta era de Big Data, no es raro encontrarse con archivos de texto de gigabytes, que pueden ser difíciles de ver incluso con herramientas integradas como el Bloc de notas o MS Excel. Para poder abrir archivos CSV tan grandes, debe descargar y utilizar una aplicación de terceros.

Si lo único que desea es ver dichos archivos, el Visor de archivos de texto grande es la mejor opción para usted. Para editarlos, puedes probar un editor de texto con muchas funciones como Emacs o optar por una herramienta premium como CSV Explorer.

Técnicas como dividir el archivo CSV o importarlo a una base de datos implican demasiados pasos. Es mejor que obtengas una licencia paga de una herramienta premium dedicada si trabajas mucho con archivos de texto de gran tamaño.

.

Artículos Relacionados:


24.10.2021