Proyectos en Inteligencia Artificial
Foto de Usuario
valdemarcolichon

Ranking Troomes
Mensajes: 1
Registrado: 11 Ago 2022, 23:55

Analisis del conjunto de datos de cancer de mama utilizando algoritmos de aprendizaje automatizado para la prediccón de

Mensaje por valdemarcolichon » 11 Ago 2022, 23:58

Analisis del conjunto de datos de cancer de mama utilizando algoritmos de aprendizaje automatizado para la prediccón de cancer de mamá.
Universidad Nacional de Ingenieria
Valdemar Colichon, William Pillaca
Facultad de Ingeniería Industrial y Sistemas
Unidad de posgrado
RESUMEN
El modelo de Wisconsin utilizado en este estudio para predecir el cáncer de mama estima los rangos de mortalidad por cáncer de mama y los resultados utilizando un modelo de clasificación que incluye datos proporcionados por el Centro de Investigación de Ciencias Clínicas de la Universidad de Wisconsin y sus aplicaciones. solía hacerlo Uso de sistemas informáticos para obtener resultados de búsqueda y resultados, usar modelos de clasificación para complementar el análisis de datos, proporcionar resultados óptimos en un tiempo significativo y proporcionar resultados a los profesionales de la salud y pudo hacerlo con tiempos de respuesta manejables.
ABSTRACT
The Wisconsin model used in this study to predict breast cancer estimates breast cancer mortality ranges and outcomes using a classification model that includes data provided by the University of Wisconsin Clinical Sciences Research Center and its affiliates. Applications. used to use computer systems to get search results and results, use classification models to supplement data analysis, provide optimal results in significant time, and provide results to healthcare professionals and could do so with manageable turnaround times.
Palabras claves: Data mining, redes neuronales, base de datos.

I. INTRODUCTION
En la actualidad se conocen diversas evaluaciones para analizar el cáncer de mama cómo son los estudios de mastografía, imágenes por resonancia magnética.
Los estudios son realizados de manera poca frecuencia y comúnmente bajo las instrucciones de algún personal de salud que teniendo por objeto la de verificar el resultado como un experto en la materia, por ello el desarrollo de este estudio tiene la finalidad de analizar y brindar un resultado sobre el cancer.
Este modelo de simulación sobre el cancer de mama tiene como objetivo estudiar el resultado y brindar una respuesta del tipo de cancer que se obtiene basándonos en la data de Wisconsin,
Cuando estos métodos de obtener un resultado son manejados en conjunto a la información extraída de grandes cantidades de datos, logra ayudar a los especialistas de la salud a la toma de decisiones.
II. ESTADO DEL ARTE
El evidente impacto del cancer de mama está aumentando en la mayoría de los países y se espera que continúe aumentando durante las próximas dos décadas a pesar de los esfuerzos actuales para prevenir la enfermedad. (Howell, y otros, 2014)
Por otra parte, en el campo de los sistemas informáticos se están realizando diversos estudios, utilizando técnicas de minería de datos, que permitan evaluar diferentes modelos de prevención y diagnóstico del cáncer de mama. Estos trabajos reportan el uso de bases de datos que contienen información sobre pacientes con cáncer de mama, demostrando la efectividad del modelo para detectar o determinar si una paciente tiene riesgo de desarrollar este tipo de cáncer. (Liou, 2016), (Asri, 2016).

Hasta el momento, estos estudios solo informan los resultados sin procesar de sus investigaciones, y no se han desarrollado sistemas para hacer que estos resultados estén disponibles, como la creación de aplicaciones móviles.
III. EVALUACIÓN DE LOS DATOS
En nuestro caso particular, se utilizaron métodos de clasificación para el análisis de datos con fines predictivos. Este es el paso más importante y dedicado en la realización de una investigación de minería de datos. Por esta razón, los resultados de interés en este estudio se extraen y extraen en cada punto de tiempo en función de los parámetros. Para ello utilizamos varias herramientas de clasificación proporcionadas por la aplicación Weka.
El método predictivo: Este usa algunas variables para predecir valores futuros o desconocidos de otras variables. Estas variables se pueden utilizar para clasificación, regresión y detección de anomalías. Este método ha demostrado ser exitosa en áreas de la medicina.
Se revisó sus diferentes técnicas para verificar cual es la que tiene mayor precisión:
Naive Bayes .- Es un clasificador de probabilidad basado en la premisa de que cada par parámetro-valor de la misma instancia es independiente del resto. A cada par parámetro-valor se le asigna una probabilidad de pertenecer a una clase. Para hacer esto, divida el número ejemplos de cada clase en la que aparece este par por el número ejemplos que pertenecen a esta clase. Para clasificar un nuevo caso, se calcula la probabilidad de pertenecer a este caso para cada clase , clasificándolo en la clase donde dicha probabilidad es mayor, aplicando así un criterio de estimación máxima de consecuencias. (John y Langley, 1995)



MLP.- Un perceptrón multicapa es una red neuronal artificial formada por muchas capas, lo que le permite resolver problemas que no pueden ser linealmente separables, que es la principal limitación de los perceptrones. Los perceptrones multicapa pueden conectarse global o localmente.
Sin imagen…
SMO.-Este algoritmo se basa en una red neuronal (el funcionamiento está inspirado en el cerebro humano, de ahí el nombre) cuya característica más importante es la capacidad de aprender a partir de ejemplos, lo que les permite generalizar sin necesidad de formalizar los conocimientos adquiridos. Contará con un aprendizaje competitivo no supervisado y sin los resultados objetivos por los que la red debe luchar.

J48.- Utiliza el algoritmo C4.5 utilizado para generar un árbol de decisión. En cada nodo del árbol, C4.5 selecciona un atributo de los datos para dividir de manera más eficiente el conjunto de muestra en subconjuntos enriquecidos en una clase u otra. El atributo con la mayor ganancia de información normalizada se elige como parámetro de decisión.

IV. RESULTADOS
Como se puede apreciar comparando con los tres algoritmos NaiveBayes - J48 – SMO la SMO nos da visibilidad de un mejor tratamiento de los resultados con un 93.8499% de una data total de 534 y siendo el NaiveBayes obteniendo el más bajo 90.50%.

V. BIBLIOGRAFÍA
1.- Breast Cancer Wisconsin Diagnostic Data Set. http://archive.ics.uci.edu/ml/datasets/ ... cer+Wiscon sin+(Diagnostic)

2.- Asri, H. (2016). Using Machine Learning Algorithms for Breast Cancer Risk Prediction and Diagnosis. Procedia Computer Science.
3.- BreastCancer.org. (2017). My Cancer Coach. Genomic Health.
4.- Valiente, A. B. (2015). Inteligencia en redes de comunicaciones. Diagnóstico cardiología.
5.- Weka (2022) Weka is open source software issued under the GNU General Public License.
6.- IEEE (2019) Breast Cancer Prediction Applying Different Classification Algorithm with Comparative Analysis using WEKA
7.- IEEE (2017) Prediction of recurrence cancer using J48 algorithm
8.- IEEE (2016) Prediction of recurrence cancer using J48 algorithm
9.- IEEE (2017) Analysis and prediction of breast cancer and diabetes disease datasets using data mining classification techniques
10.- IEEE (2018) An Implementation of Naive Bayes Classifier
Adjuntos
Predicción de clasificación de cancer.pptx
(1.83 MiB) Descargado 36 veces


Responder