Topics about Data Sciences and BI
Responder
Foto de Usuario
asistemas

Ranking Troomes
Mensajes: 1
Registrado: 29 Sep 2021, 08:04
Contactar:

Data Analysis with PANDAS

Mensaje por asistemas » 29 Sep 2021, 09:16

Es posible que no conozcas lo que es el Data Science, ni mucho menos lo que es Pandas. Por ello, de lo primero que vamos a hablar en este artículo es sobre qué es el Data Science para adentrarnos qué es la librería Pandas. :geek: :geek:
¿Qué es el Data Science?
El Data Science es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurado o no estructurado, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
El Data Science combina software, estadística, matemática, programación y visualización. Y su objetivo es extraer datos factibles de interpretarse e incluso crear nueva información. Las conclusiones que se obtienen permiten desarrollar productos demandados en el mercado o generar oportunidades de negocio de una empresa.
¿Qué es pandas?
En Computación y Ciencia de datos, pandas es una biblioteca de software escrita como extensión de Numpy para manipulación y análisis de datos para el lenguaje de programación Python. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.
Las características de la biblioteca son:
El tipo de datos son DataFrame para manipulación de datos con indexación integrada. Tiene herramientas para leer y escribir datos entre estructuras de dato en memoria y formatos de archivos variados
Permite la alineación de dato y manejo integrado de datos faltantes, la reestructuración y segmentación de conjuntos de datos, la segmentación vertical basada en etiquetas, indexación elegante, y segmentación horizontal de grandes conjuntos de datos, la inserción y eliminación de columnas en estructuras de datos.
Puedes realizar cadenas de operaciones, dividir, aplicar y combinar sobre conjuntos de datos, la mezcla y unión de datos.
Permite realizar indexación jerárquica de ejes para trabajar con datos de altas dimensiones en estructuras de datos de menor dimensión, la funcionalidad de series de tiempo: generación de rangos de fechas y conversión de frecuencias, desplazamiento de ventanas estadísticas y de regresiones lineales, desplazamiento de fechas y retrasos.
Como podemos ver, se trata de una herramienta realmente eficaz con multiplicidad de usos, lo que la convierte en excelente para el tratamiento de datos, y dada su sencillez, también es apta para usuarios poco expertos en la programación, lo que ha convertido a Python en un lenguaje de programación muy usado y muy demandado.

aquí te voy a dejar un link con las variables más usadas y métodos
Data Analysis with PANDAS CHEAT SHEET
Adjuntos


Foto de Usuario
carlosmirandad

Ranking Troomes
Mensajes: 3
Registrado: 28 Abr 2024, 10:01
Ubicación: Dallas, TX
Contactar:

Re: Data Analysis with PANDAS

Mensaje por carlosmirandad » 28 Abr 2024, 14:20

Excelente resumen, ¡gracias por compartir! Lo leí con atención y lo encontré muy acertado.

Al haber estado practicando Data Science por 15 años, tengo comentarios que añadir. De las dos palabras que forman el término "Data Science", la más importante es la segunda y es una que a veces no recibe tanta atención. Por ejemplo, durante un análisis es importante aplicar el pensamiento crítico y cuestionar incluso nuestras propias hipótesis en busca de explicaciones alternativas. Digamos que estamos analizando los resultados de una campaña de marketing y vemos un aumento en los ingresos. Podríamos asumir que esos resultados son atribuibles a la campaña (y a veces asumir cosas es adecuado y necesario), pero mucho mejor es preguntarse: ¿estoy seguro de que los resultados que estoy midiendo fueron causados por la campana o es posible que otros factores hayan contribuido a ellos? Tal vez hubo un cambio en precio, competencia, o en la economía en general. ¿Qué metodología puedo utilizar para medir la contribución exacta de la campana? En la práctica, suelen haber muchos factores que afectan nuestras mediciones, pero felizmente hay formas de manejar ese problema de forma científica. Si lo hacemos objetivamente, la validez de nuestras conclusiones y los beneficios para nuestra compañía serán mayores.

En resumen, Data Science es mucho más que manipular, analizar y visualizar datos; es un proceso riguroso y sistemático para obtener conocimiento a partir de ellos, aplicando el pensamiento crítico y la búsqueda de la verdad.


Responder