Márcio Porto Basgalupp
Instituto de Ciência e Tecnologia
Programa de Pós-Graduação: Ciência da Computação
Programa de Pós-Graduação: Inovação Tecnológica
E-Mail: basgalupp@unifesp.br
Resumo
é bacharel em Ciência da Computação pela Universidade Federal de Pelotas (2005), mestre em Ciência da Computação pela PUCRS (2007) e doutor em Ciências de Computação e Matemática Computacional pela Universidade de São Paulo (2010). Realizou doutorado sanduíche na University of Kent, na Inglaterra, em 2009, sob supervisão do Dr. Alex A. Freitas. No ano de 2010, realizou pós-doutorado na NTNU (Norwegian University of Science and Technology), na cidade de Trondheim, Noruega. Atualmente, é Prof. Associado II do Instituto de Ciência e Tecnologia da Universidade Federal de São Paulo (UNIFESP), campus São José dos Campos, SP. Foi coordenador e um dos idealizadores do Programa de Pós-Graduação em Ciência da Computação (PPG-CC) do ICT-UNIFESP desde a sua confecção (e consequente abertura do programa, em 2012) até a aprovação do curso de doutorado, que teve início em 2015. Em 2016, ficou mais um período na University of Kent, dessa vez como pós-doutorando. Tem coordenado diversos projetos de pesquisa com financiamento das principais agências de fomento do país, em particular CNPq e FAPESP, tanto no âmbito nacional como internacional. É um dos Pesquisadores Principais do Centro de Pesquisa Aplicada (CPA) em Inteligência Artificial, IARA. Seus principais interesses de pesquisa estão relacionados às áreas de Data Science, Aprendizado de Máquina, Computação Bioinspirada e Cidades Inteligentes. Desde março de 2014, é bolsista de produtividade em pesquisa do CNPq.
Fonte: Lattes CNPq
Nomes em citações bibliográficas
BASGALUPP, M. P.;Basgalupp, Marcio P.;Basgalupp, Márcio P.;BASGALUPP, Márcio P;BASGALUPP, MARCIO R;BASGALUPP, MÁRCIO PORTO;Basgalupp, Marcie P.;Basgalupp, Marcie Porto;Porto Basgalupp, Marcie;BASGALUPP, MARCIO
Exportar dados
Exportar produção no formato BIBTEX
Perfis na web
Tags mais usadas
Pular nuvens de palavrasIdiomas
Espanhol
Compreende razoavelmente, Fala pouco, Lê razoavelmente, Escreve pouco
Inglês
Compreende bem, Fala bem, Lê bem, Escreve bem
Formação
Doutorado em Ciências da Computação e Matemática Computacional
LEGAL-Tree: Um algoritmo genético multiobjetivo para indução de árvores de decisão
Orientação: André Carlos Ponce de Leon Ferreira de Carvalho
Universidade de São Paulo
Mestrado em Ciência da Computação
Algoritmos genéticos para seleção de atributos em problemas de classificação de processos de negócio
Orientação: Vera Lúcia Strube de Lima
Pontifícia Universidade Católica do Rio Grande do Sul
2005 a 2007
Graduação em Bacharelado em Ciência da Computação
Universidade Federal de Pelotas
2001 a 2004
Produção
2024
-
-
An Experimental Analysis on Automated Machine Learning for Software Defect Prediction (2024)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Barros, Rodrigo C.; Tiago S. da Silva; Fábio Silveira; Péricles Barbosa Cunha de Miranda; Ferrante Neri
Fonte: IEEE Congress on Evolutionary Computation (CEC)
-
Automated CNN optimization using multi-objective grammatical evolution (2024)
Artigo publicado
Autores: Cleber A.C.F. da Silva; Daniel Carneiro Rosa; Péricles Barbosa Cunha de Miranda; Tapas Si; CERRI, RICARDO; Márcio Porto Basgalupp
Fonte: APPLIED SOFT COMPUTING , v. 151 , p. 111124 - Extrato QUALIS: A1
2023
-
Swapping training optimizers and tiny partial datasets to improve performance of lighter neural networks for edge devices (2023)
Trabalhos em eventos
Autores: Alexandre Moreira Nascimento; Vinícius Veloso de Melo; Márcio Porto Basgalupp
Fonte: Proceedings of the 38th ACM Symposium on Applied Computing
-
-
-
A Grammar-based multi-objective neuroevolutionary algorithm to generate fully convolutional networks with novel topologies (2023)
Artigo publicado
Autores: MIRANDA, THIAGO Z.; SARDINHA, DIORGE B.; NERI, FERRANTE; Márcio Porto Basgalupp; CERRI, RICARDO
Fonte: APPLIED SOFT COMPUTING , v. 149 , p. 110967 - Extrato QUALIS: A1
-
2022
-
A New Grammatical Evolution Method for Generating Deep Convolutional Neural Networks with Novel Topologies (2022)
Trabalhos em eventos
Autores: MIRANDA, THIAGO ZAFALON; SARDINHA, DIORGE BROGNARA; Márcio Porto Basgalupp; CERRI, RICARDO
Fonte: Proceedings of the 2022 Genetic and Evolutionary Computation Conference
-
An Analysis of the Influence of Noneffective Instructions in Linear Genetic Programming (2022)
Artigo publicado
Autores: Léo Sotto; ROTHLAUF, FRANZ; Vinícius Veloso de Melo; Márcio Porto Basgalupp
Fonte: EVOLUTIONARY COMPUTATION (ONLINE) , v. 30 , p. 51 - Extrato QUALIS: A1
2021
-
An extensive experimental evaluation of automated machine learning methods for recommending classification algorithms (2021)
Artigo publicado
Autores: Márcio P. Basgalupp; RODRIGO C. BARROS; DE SÁ, A. G. C.; PAPPA, G. L.; MANTOVANI, R. G.; André Carlos Ponce de Leon Ferreira de Carvalho; Alex A. Freitas
Fonte: Evolutionary Intelligence (Print) , v. 14 , p. 1895 - Extrato QUALIS: A3
-
Beyond global and local multi-target learning (2021)
Artigo publicado
Autores: Márcio Porto Basgalupp; CERRI, RICARDO; Leander Schietgat; Isaac Triguero; Celine Vens
Fonte: INFORMATION SCIENCES , p. 508 - Extrato QUALIS: A1
-
Graph representations in genetic programming (2021)
Artigo publicado
Autores: Léo Sotto; Paul Kaufmann; Timothy Atkinson; Roman Kalkreuth; Márcio Porto Basgalupp
Fonte: Genetic Programming and Evolvable Machines , v. 1 , p. 1 - Extrato QUALIS: A3
2020
-
Generation of consistent sets of multi-label classification rules with a multi-objective evolutionary algorithm (2020)
Trabalhos em eventos
Autores: MIRANDA, THIAGO ZAFALON; SARDINHA, DIORGE BROGNARA; Márcio Porto Basgalupp; JIN, YAOCHU; CERRI, RICARDO
Fonte: Proceedings of the 2020 Genetic and Evolutionary Computation Conference Companion , p. 143
-
A study on graph representations for genetic programming (2020)
Trabalhos em eventos
Autores: SOTTO, LÉO FRANÇOSO D. P.; KAUFMANN, PAUL; ATKINSON, TIMOTHY; KALKREUTH, ROMAN; Márcio Porto Basgalupp
Fonte: Proceedings of the 2020 Genetic and Evolutionary Computation Conference , p. 931
2019
-
Inducing Hierarchical Multi-label Classification rules with Genetic Algorithms (2019)
Artigo publicado
Autores: Ricardo Cerri; Rodrigo Coelho Barros; Márcio P. Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: APPLIED SOFT COMPUTING , v. 77 , p. 584 - Extrato QUALIS: A1
2018
-
NGA-LP: A Robust and Improved Genetic Algorithm to Detect Communities in Directed Networks (2018)
Trabalhos em eventos
Autores: FRANCISQUINI, RODRIGO; NASCIMENTO, MARIA C. V.; Márcio Porto Basgalupp
Fonte: 2018 IEEE Congress on Evolutionary Computation (CEC) , p. 1
-
Automatic Design of Evolutionary Algorithms Based on Entropy Triggers (2018)
Trabalhos em eventos
Autores: RIBEIRODA SILVA, GUILHERME; BASGALUPP, MARCIE P.; Ana Carolina Lorena
Fonte: 2018 IEEE Congress on Evolutionary Computation (CEC) , p. 1
-
Increasing Boosting Effectiveness with Estimation of Distribution Algorithms (2018)
Trabalhos em eventos
Autores: CAGNINI, HENRY E.L.; Márcio Porto Basgalupp; Barros, Rodrigo C.
Fonte: 2018 IEEE Congress on Evolutionary Computation (CEC) , p. 1
-
Multi-label Feature Selection Techniques for Hierarchical Multi-label Protein Function Prediction (2018)
Trabalhos em eventos
Autores: CERRI, RICARDO; MANTOVANI, RAFAEL G.; BASGALUPP, MARCIO P.; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: 2018 International Joint Conference on Neural Networks (IJCNN) , p. 1
-
Extracting Rules for Black Jack Using Machine Learning and Fuzzy Systems (2018)
Trabalhos em eventos
Autores: CARDOSO, KARLA R.; CINTRA, MARCOS E.; Márcio Porto Basgalupp
Fonte: 2018 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE) , p. 1
2017
-
-
Estimation of distribution algorithms for decision-tree induction (2017)
Trabalhos em eventos
Autores: CAGNINI, HENRY E. L.; Barros, Rodrigo C.; Márcio Porto Basgalupp
Fonte: 2017 IEEE Congress on Evolutionary Computation (CEC) , p. 2022
-
-
-
$${lambda }$$ λ -LGP: an improved version of linear genetic programming evaluated in the Ant Trail problem (2017)
Artigo publicado
Autores: Léo Sotto; Vinícius Veloso de Melo; Márcio Porto Basgalupp
Fonte: KNOWLEDGE AND INFORMATION SYSTEMS (ELECTRONIC RESOURCE) , p. 445 - Extrato QUALIS: A2
2016
-
Medoid-based Data Clustering with Estimation of Distribution Algorithms (2016)
Trabalhos em eventos
Autores: H. CAGNINI; Rodrigo Coelho Barros; Christian V. Quevedo; Márcio Porto Basgalupp
Fonte: Proceedings of the 31st ACM Symposium on Applied Computing
-
An improved λ-Linear Genetic Programming evaluated in solving the Santa Fe Ant Trail problem (2016)
Trabalhos em eventos
Autores: Léo Sotto; Vinícius Veloso de Melo; Márcio Porto Basgalupp
Fonte: Proceedings of the 31st ACM Symposium on Applied Computing (SAC)
-
Enhancing discrimination power with genetic feature construction: A grammatical evolution approach (2016)
Trabalhos em eventos
Autores: MIQUILINI, PATRICIA; Barros, Rodrigo C.; DE MELO, VINICIUS V.; Márcio Porto Basgalupp
Fonte: 2016 IEEE Congress on Evolutionary Computation (CEC) , p. 3824
2015
-
Clustering Molecular Dynamics Trajectories with a Univariate Estimation of Distribution Algorithm (2015)
Trabalhos em eventos
Autores: Barros, Rodrigo C.; Christian V. Quevedo; Renata de Paris; Márcio Porto Basgalupp
Fonte: 2015 IEEE Congress on Evolutionary Computation (CEC)
-
Evolving Balanced Decision Trees with a Multi-Population Evolutionary Algorithm (2015)
Trabalhos em eventos
Autores: Vili Podgorelec; Saso Karakatic; Barros, Rodrigo C.; Márcio Porto Basgalupp
Fonte: 2015 IEEE Congress on Evolutionary Computation (CEC)
-
Evolving Decision-Tree Induction Algorithms with a Multi-Objective Hyper-Heuristic (2015)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Barros, Rodrigo C.; Vili Podgorelec
Fonte: Proceedings of the 30th ACM Symposium On Applied Computing (SAC)
-
2014
-
-
A grammatical evolution based hyper-heuristic for the automatic design of split criteria (2014)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Barros, Rodrigo C.; Tiago Barabasz
Fonte: Proceedings of the 2014 Conference on Genetic and Evolutionary Computation (GECCO '14) , p. 1311
-
Evolutionary Design of Decision-Tree Algorithms Tailored to Microarray Gene Expression Data Sets (2014)
Artigo publicado
Autores: Rodrigo Barros; Márcio Basgalupp; Alex Freitas; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION , v. 18 , p. 873 - Extrato QUALIS: A1
-
Evolving decision trees with beam search-based initialization and lexicographic multi-objective evaluation (2014)
Artigo publicado
Autores: Márcio Basgalupp; Rodrigo Barros; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas
Fonte: Information Sciences , v. 258 , p. 160 - Extrato QUALIS: A1
-
Investigating fitness functions for a hyper-heuristic evolutionary algorithm in the context of balanced and imbalanced data classification (2014)
Artigo publicado
Autores: Rodrigo C. Barros; BASGALUPP, MÁRCIO P.; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: Genetic Programming and Evolvable Machines (Print) , v. 16 , p. 241 - Extrato QUALIS: A3
2013
-
A grammatical evolution approach for software effort estimation (2013)
Trabalhos em eventos
Autores: Rodrigo C. Barros; BASGALUPP, MÁRCIO P.; Ricardo Cerri; DA SILVA, TIAGO S.; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: Proceeding of the fifteenth annual conference on Genetic and evolutionary computation conference - GECCO '13 , p. 1413
-
Software effort prediction (2013)
Trabalhos em eventos
Autores: BASGALUPP, MÁRCIO P.; Rodrigo C. Barros; DA SILVA, TIAGO S.; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: Proceedings of the 28th Annual ACM Symposium on Applied Computing - SAC '13 , p. 1109
-
-
Automatic Design of Decision-Tree Algorithms with Evolutionary Algorithms (2013)
Artigo publicado
Autores: Rodrigo Coelho Barros; Márcio P. Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Alex A. Freitas
Fonte: EVOLUTIONARY COMPUTATION , v. 21 , p. 659 - Extrato QUALIS: A1
-
2012
-
Clus-DTI: Improving Decision-Tree Classification with a Clustering-based Decision-Tree Induction Algorithm (2012)
Artigo publicado
Autores: Rodrigo Barros; Márcio Basgalupp; M.Quiles; André Carlos Ponce de Leon Ferreira de Carvalho
Fonte: Journal of the Brazilian Computer Society (Impresso) , v. 18 , p. 351 - Extrato QUALIS: A2
-
Predicting software maintenance effort through evolutionary-based decision trees (2012)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Barros, Rodrigo C.; Ruiz, Duncan D.
Fonte: Proceedings of the 27th Annual ACM Symposium on Applied Computing - SAC '12
-
A hyper-heuristic evolutionary algorithm for automatically designing decision-tree algorithms (2012)
Trabalhos em eventos
Autores: Rodrigo Barros; Márcio Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas
Fonte: Proceedings of the fourteenth international conference on Genetic and evolutionary computation conference (GECCO '12) , p. 1237
-
-
A Survey of Evolutionary Algorithms for Decision Tree Induction (2012)
Artigo publicado
Autores: Rodrigo Barros; Márcio Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas
Fonte: IEEE Transactions on Systems, Man and Cybernetics. Part C, Applications and Reviews , v. 42 , p. 291
-
Automatic Design of Decision-Tree Induction Algorithms Tailored to Flexible-Receptor Docking Data (2012)
Artigo publicado
Autores: Rodrigo Barros; Ana T. Winck; Karina Machado; Márcio Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Duncan Ruiz; Osmar Norberto de Souza
Fonte: BMC Bioinformatics , v. 13 , p. 310 - Extrato QUALIS: A1
-
A Beam Search based Decision Tree Induction Algorithm (2012)
Capítulo de livro publicado
Autores: Márcio Porto Basgalupp; Rodrigo Coelho Barros; André C. P. L. F. de Carvalho; Alex A. Freitas
Fonte: Machine Learning Algorithms for Problem Solving in Computational Applications: Intelligent Techniques , p. 1
2011
-
Towards the Automatic Design of Decision Tree Induction Algorithms (2011)
Trabalhos em eventos
Autores: Rodrigo Barros; Márcio Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas
Fonte: 1st Workshop on Evolutionary Computation for Designing Generic Algorithms - GECCO 2011 , p. 1
-
-
Evolutionary model trees for handling continuous classes in machine learning (2011)
Artigo publicado
Autores: Rodrigo Coelho Barros; Márcio Porto Basgalupp; Duncan Ruiz
Fonte: Information Sciences , v. 181 , p. 954 - Extrato QUALIS: A1
-
A clustering-based decision tree induction algorithm (2011)
Trabalhos em eventos
Autores: Barros, Rodrigo C.; DE CARVALHO, ANDRE C. P. L. R; Márcio Porto Basgalupp; QUILES, MARCOS G.
Fonte: 2011 11th International Conference on Intelligent Systems Design and Applications , p. 543
2010
-
Evolutionary Model Tree Induction (2010)
Trabalhos em eventos
Autores: Rodrigo Barros; Márcio Basgalupp; Duncan Ruiz; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas
Fonte: Proceedings ACM SAC 2010 , p. 1131
2009
-
Lexicographic multi-objective evolutionary induction of decision trees (2009)
Artigo publicado
Autores: Márcio Basgalupp; André Carlos Ponce de Leon Ferreira de Carvalho; Rodrigo Barros; Duncan Ruiz; Alex Freitas
Fonte: International Journal of Bio-Inspired Computation (Print) , v. 1 , p. 105 - Extrato QUALIS: A2
-
LEGAL-tree: a lexicographic multi-objective genetic algorithm for decision tree induction (2009)
Trabalhos em eventos
Autores: Márcio Basgalupp; Rodrigo Barros; André Carlos Ponce de Leon Ferreira de Carvalho; Alex Freitas; Duncan Ruiz
Fonte: Proceedings of the 2009 ACM symposium on Applied Computing , p. 1085
-
Issues on Estimating Software Metrics in a Large Software Operation (2009)
Trabalhos em eventos
Autores: Barros, Rodrigo C.; Márcio Porto Basgalupp; Nélson Tenório; Duncan Ruiz; Karin Becker
Fonte: proceedings of 32nd Annual IEEE Software Engineering Workshop
2007
2006
-
-
A Study of Multi-Objective Fitness Functions for a Feature Selection Genetic Algorithm (2006)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Karin Becker; Duncan Dubugras Ruiz
Fonte: Proceedings of the Second Workshop on Feature Selection for Data Mining: Interfacing Machine Learning and Statistics , p. 123
-
-
2005
-
-
ANÁLISE DO COMPORTAMENTO DAS CHUVAS EM ALGUMAS LOCALIDADES DO SEMI ÁRIDO DO NORDESTE BRASILEIRO (2005)
Artigo publicado
Autores: João Baptista da Silva; Felipe Böhm Cunha; Sheila Radmman da Paz; Márcio Porto Basgalupp
Fonte: Revista Brasileira de Agrometeorologia , v. 13 , p. 73 - Extrato QUALIS: B4
-
-
-
-
-
UTILIZAÇÃO DAS TÉCNICAS DE REDES NEURAIS ARTIFICIAIS E ALGORITMOS GENÉTICOS PARA MODELAGEM E PREVISÃO DE PRECIPITAÇÕES PLUVIAIS EM PELOTAS, RS, BRASIL (2005)
Trabalhos em eventos
Autores: Márcio Porto Basgalupp; Mário Lúcio Mesquita Machado; João Artur de Souza; João Baptista da Silva
Fonte: ANAIS DO IX CONGREMET. BUENOS AIRES , p. 87
2004
-
-
-
-
-
-
-
-
-
Temperatura Máxima do Ar em Pelotas, RS - Tabelas de Probabilidades das Médias das Máximas Pentadais (2004)
Trabalhos em eventos
Autores: Joao Baptista da Silva; Marta Pereira Llopart; Nathalie Boiaski; Márcio Porto Basgalupp; Diego Oliveira de Souza
Fonte: Meteorologia e o Desenvolvimento Sustentável
-
Temperatura Média do Ar em Pelotas, RS - Tabelas de Probabilidades das Máximas Absolutas Pentadais (2004)
Trabalhos em eventos
Autores: Joao Baptista da Silva; Marta Pereira Llopart; Nathalie Boiaski; Diego Oliveira de Souza; Márcio Porto Basgalupp
Fonte: Meteorologia e o Desenvolvimento Sustentável
-
-
-
2003
Atuações
Universidade Federal de São Paulo
-
Prof. Associado
Desde 2010
Computational Intelligence (Online)
-
Revisor de periódico
Desde 2011
Computational Intelligence
-
Revisor de periódico
Desde 2011
Information Sciences
-
Revisor de periódico
Desde 2012
IEEE Transactions on Evolutionary Computation
-
Revisor de periódico
Desde 2012
Neurocomputing (Amsterdam)
-
Revisor de periódico
Desde 2012
Scientific Reports Nature
-
Revisor de periódico
Desde 2020
Universidade de São Paulo
-
Desde 2022
Universidade Federal de São Carlos
-
2016 a 2018
Intelligent Data Analysis
-
Membro de corpo editorial
Desde 2022
Universidade Federal de Pernambuco
-
Desde 2022
Ensino
Orientações e supervisões
Tese de doutorado em andamento
-
Geração de Redes Neurais Profundas com Algoritmos Evolutivos
Ciência da Computação
Universidade Federal de São Carlos
Desde 2021
-
Construção automatizada de modelos de Dinâmica de Sistemas
Ciência da Computação
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Universidade Federal de São Paulo
Desde 2019
Dissertação de mestrado em andamento
-
Técnicas de reamostragem para PLN
Programa de Pós-Graduação em Ciência da Computação
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Universidade Federal de São Palulo - Campus São José dos Campos
Desde 2023
-
Pedro Henrique Pontes Gonçalves
Automatização de processos em operações de cartões de crédito utilizando técnicas de aprendizado de máquina
Engenharia de Produção
Universidade Estadual Paulista Júlio de Mesquita Filho
Desde 2020
Tese de doutorado concluídas
-
Development of Estimation of Distribution Algorithms for Linear Genetic Programming
Ciência da Computação
Fundação de Amparo à Pesquisa do Estado de São Paulo
Universidade Federal de São Paulo
Concluído em 2020
-
Investigação da Fusão da Técnica de Controle Fuzzy e/ou SDRE/H Visando Projetar um Controlador Robusto para um Satélite Rígido-Flexível
ENGENHARIA E TECNOLOGIA ESPACIAIS
Instituto Nacional de Pesquisas Espaciais
Concluído em 2015
Dissertação de mestrado concluídas
-
Construção Automática de Funções de Kernel para Support Vector Machines por meio de Evolução Gramatical
Ciência da Computação
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Universidade Federal de São Paulo
Concluído em 2017
-
Evolução Gramatical para Construção Automática de Funções de Dissimilaridade no Contexto de Aprendizado Semissupervisionado
Programa de Pós-Graduação em Ciência da Computação
Fundação de Amparo à Pesquisa do Estado de São Paulo
Universidade Federal de São Palulo - Campus São José dos Campos
Concluído em 2017
-
Um estudo sobre redes profundas aplicadas a dados de fMRI
Ciência da Computação
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Universidade Federal de São Paulo
Concluído em 2016
-
Construção automática de algoritmos de indução de árvores de decisão: uma abordagem multiobjetiva
Programa de Pós-Graduação em Ciência da Computação
Universidade Federal de São Paulo - São José dos Campos
Concluído em 2015
Gestão
Pesquisa
Universidade Federal de São Paulo
-
Neuro-GEMA: A Grammar-based Evolutionary Method to Automatically Design Flexible Convolutional Neural Networks
Neural Architecture Search (NAS) is a research field that utilises evolutionary algorithms to generate/optimise neural networks. In recent years, NAS-based algorithms have created models that outperform hand-craft designs in some tasks, settings the new state-of-the-art. In this research project, we will utilise grammar-based multi-objective NAS algorithms to generate deep convolutional neural networks (CNNs). The utilisation of a grammar-based approach to describe and explore the search space allows the researchers to inject domain knowledge into the search process and creates an interface between genotypes and phenotypes that facilitates experimentation, while the multi-objective approach will enable the identification of models with good compromises between predictive power and other metrics, such as model size. The Brazilian partners of this proposal are researchers in the IARA Project (Artificial Intelligence in the Remaking of Urban Environments) funded by FAPESP, a joint nationwide collaboration involving universities and companies in Brazil. Thus, the CNNs discovered are intent to be applied in smart city related problems, such as detecting breeding grounds of disease-carrying mosquitoes and detecting construction materials left on illegal locations, such as sidewalks.
Autores: Márcio Porto Basgalupp, CERRI, RICARDO, Ferrante Neri, Spencer Thomas, Zhenhua Feng
Desde 2023
-
Construção e seleção automática de algoritmos de aprendizado de máquina
O uso de meta-learning para recomendação de algoritmos é uma área de pesquisa que tem sido amplamente explorada nos últimos anos. Sistemas de meta-learning para recomendação de algoritmos podem ser divididos em dois grandes grupos: (a) sistemas que realizam seleção de algoritmos ou modelos baseados em meta-features; e (b) sistemas que buscam pelo melhor algoritmo de classificação possível em um dado espaço de algoritmos, uma abordagem relativamente menos investigada que a anterior. Em trabalhos prévios do proponente e seus colaboradores, foram desenvolvidos três sistemas representativos de meta-learning baseados em busca para a construção automática de algoritmos. Todos eles utilizaram o paradigma de algoritmos evolutivos como método de busca, porém construindo diferentes tipos de algoritmos de classificação -- indução de regras, indução de árvores de decisão, e indução de redes bayesianas. Esses três sistemas de meta-learning, até onde se sabe, são as únicas abordagens de meta-learning para a construção automática de algoritmos encontradas na literatura. Assim, a ideia deste projeto de pesquisa é avançar na área de construção automática de algoritmos de aprendizado de máquina, mais especificamente classificação. Dentre os tópicos considerados em aberto nessa área, é possível destacar: (I) desenvolvimento de abordagens baseadas em diferentes métodos de busca; (II) evolução de árvores de decisão com múltiplos testes; (III) implementação de abordagens multi-objetivas; (IV) construção automática de funções de similaridade no contexto de aprendizado semissupervisionado; (V) evolução automática de redes neurais profundas; (VI) construção automática de comitê de classificadores; (VII) construção automática de preditores multi-target; e (VIII) estudo comparativo das abordagens de meta-learning para seleção/configuração e construção de algoritmos de classificação.
Autores: Márcio Porto Basgalupp, Ana Carolina Lorena, CERRI, RICARDO, André Carlos Ponce de Leon Ferreira de Carvalho, Teresa Bernarda Ludermir, George Darmiton da Cunha Cavalcanti, Péricles Barbosa Cunha de Miranda, Cleber Zanchettin
Desde 2022
-
Construção automática de algoritmos de indução de árvores de decisão com híper-heurística multi-objetiva usando a abordagem de Pareto
O objetivo da proposta de colaboração de pesquisa é projetar, desenvolver e avaliar uma versão estendida de um algoritmo de indução de árvore de decisão com uma híper-heurística multi-objetiva usando abordagem de dominância de Pareto. Os resultados prévios já mostraram as vantagens de evoluir algoritmos de indução de árvores de decisão com uma híper-heurística considerando somente o desempenho de classificação. No entanto, a acurácia e outras medidas de desempenho de classificadores não são os únicos indicadores de qualidade das árvores geradas. Uma vantagem muito importante das árvores de decisão é a transparência das decisões tomadas pelo modelo, cuja interpretabilidade é semelhate ao pensamento humano. Isso tem sido mostrado em diversas aplicações do mundo real, em que a validação dos resultados de classificação é tão importante como a classificação por si só (em Medicina, por exemplo), que a simplicidade de uma árvore não deveria ser comprometida às custas da acurácia. Ambos os objetivos (acurácia e complexidade das árvores de decisão), no entanto, são geralmente conflitantes. Para solucionar este problema, é proposto o uso de uma abordagem de otimização multi-objetiva apropriadamente projetada e implementada.
Autores: Márcio Porto Basgalupp, Barros, Rodrigo C., Vili Podgorelec
2015 a 2015
-
Hiper-heurísticas multi-objetivas para construção automática de algoritmos de indução de árvores de decisão com múltiplos testes
Árvores de Decisão constituem uma técnica poderosa e amplamente utilizada em tarefas de aprendizado de máquina e mineração de dados, principalmente em virtude da facilidade de interpretação do conhecimento adquirido. Em contraste com os algoritmos tradicionais de indução de árvores de decisão - todos manualmente desenvolvidos por humanos - o algoritmo HEAD-DT constitui uma abordagem de hiper-heurística evolutiva para construção automática de algoritmos de indução de árvores de decisão. HEAD-DT trabalha sobre diversos componentes manualmente desenvolvidos para indução de árvores de decisão, combinando os componentes mais adequados para o problema em questão. Recentemente, foi introduzido o conceito de árvores de decisão com múltiplos testes (MTDT, do inglês Multi-Test Decision Trees), uma nova forma de representação de árvores de decisão. Nas MTDT, cada nó da árvore pode ser composto por múltiplos testes univariados, o que pode ser visto como um caso intermediário (em termos de interpretabilidade) entre as árvores de decisão univariadas e as árvores de decisão multivariadas. Em relação aos algoritmos tradicionais de árvores de decisão univariadas, os algoritmos de indução das MTDT possuem certas particularidades. O critério de split é um exemplo claro, em que pode ser conduzido por um mecanismo de votação majoritária em que todos os testes univariados têm a mesma importância. No entanto, diversas outras estratégias podem ser desenvolvidas para realizar essa tarefa. Nesse contexto, o presente projeto propõe estender o algoritmo HEAD-DT em dois principais aspectos: (i) construir automaticamente algoritmos de indução de árvores de decisão com múltiplos testes, e algumas extensões; e (ii) adotar três abordagens multi-objetivas para guiar o processo evolutivo. Embora muitos trabalhos utilizem algoritmos evolutivos para indução de árvores de decisão, o que se propõe aqui é algo totalmente diferente, pois a ideia é evoluir algoritmos genéricos para indução de árvores de decisão de múltiplos testes, ou seja, o resultado final do método será um algoritmo de indução, e não apenas uma árvore de decisão. Isso caracteriza um algoritmo de meta-learning, pois o objetivo é aprender um algoritmo de aprendizagem.
Autores: Márcio Porto Basgalupp, Barros, Rodrigo C., Vili Podgorelec, Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, Alex A. Freitas, Barros, Rodrigo C.
2016 a 2018
-
Hyper-heuristics and Decision Trees for Hierarchical Multi-label Classification Problems
Hierarchical Multi-label Classification (HMC) is a complex problem, in which classes involved are structured in a hierarchy with hundreds or even thousands of classes. Additionally, instances can be simultaneously classified into more than one path in this hierarchy. These problems are very common, for example, in protein function prediction and annotation of medical images. Among the different algorithms that can be used in these problems, decision tree induction algorithms are a good choice, due their robustness and efficiency, and also because they produce interpretable models with satisfactory performances. However, there are still many open questions about the use of these algorithms in the HMC context, such as which stop and prune criteria to use, which split to use in an internal node, and how to consider the relationships between classes. In addition, only the top-down strategy was used until now. Given such many configuration possibilities, this project aims at implementing a hyper-heuristic for the construction of decision tree induction algorithms, tailored to HMC problems. In contrast to meta-heuristics, hyper-heuristics operate in a higher abstraction level, being used in the search for the best combination of components in the space of possibilities. These components are used to construct the decision tree induction algorithms.
Autores: Márcio Porto Basgalupp, CERRI, RICARDO, Leander Schietgat
2016 a 2016
-
Hiper-heurísticas para Construção de Algoritmos de Indução de Árvores de Decisão em Problemas de Classificação Hierárquica Multirrótulo
Problemas de Classificação Hierárquica Multirrótulo são problemas de classificação complexos, nos quais as classes envolvidas no problema são estruturadas em uma hierarquia contendo centenas ou até milhares de classes. Adicionalmente, exemplos sendo classificados podem ser atribuídos simultaneamente a mais de um caminho dessa hierarquia. Esses problemas são muito comuns, por exemplo em tarefas de predição de funções de proteínas e anotação de imagens médicas. Dentre os diferentes algoritmos que podem ser utilizados nesses problemas, estão os algoritmos de indução de árvores de decisão, por sua robustez e eficiência, além de produzirem modelos interpretáveis e com taxas de acerto satisfatórias. Apesar disso, ainda há muitas questões em aberto sobre a utilização desses algoritmos no contexto de problemas de classificação hierárquica multirrótulo, como por exemplo quais critérios de parada e de poda utilizar, qual tipo de divisão utilizar em um nó interno, e como considerar os relacionamentos entre as classes. Além disso, até agora apenas a estratégia de indução top-down foi utilizada. Dadas essas muitas possibilidades de configuração, esse projeto tem por objetivo implementar uma hiper-heurítica para a construção de algoritmos de indução de árvores de decisão aplicados em problemas de classificação hierárquica multirrótulo. Ao contrário das meta-heurísticas, as hiper-heurísticas operam em um nível maior de abstração, podendo ser utilizadas na procura das melhores combinações de componentes no espaço de possibilidades, componentes esses utilizados para a construção de algoritmos de indução de árvores de decisão.
Autores: Márcio Porto Basgalupp, Ricardo Cerri, Celine Vens, Leander Schietgat
2015 a 2017
-
Hiper-heurísticas evolutivas para construção automática de algoritmos de Aprendizado de Máquina
No contexto de aprendizado de máquina, as árvores de decisão constituem uma alternativa natural aos poderosos métodos do tipo "caixa-preta", tais como SVM e Redes Neurais Artificiais, devido à facilidade de compreensão de suas decisões, as quais são semelhantes à forma do raciocínio humano. Além da interpretabilidade, os algoritmos de indução de árvores de decisão também apresentam outras vantagens, tais como como robustez a ruídos, baixo custo computacional e capacidade para lidar com atributos redundantes. No entanto, a busca pela árvore de decisão ótima para um determinado conjunto de dados é considerada uma tarefa difícil, e com isso heurísticas se tornaram essenciais para tratar o problema em tempo hábil. Dentre as heurísticas propostas na literatura, nenhuma tem obtido tanto sucesso em gerar árvores de decisão compreensivas, precisas (em ternos de acurácia) e com baixo esforço computacional como a estratégia de indução top-down. Tendo em vista a imensa gama de trabalhos nos últimos 40 anos propondo novos design components - todos manualmente desenvolvidos por humanos - o presente projeto destaca uma ótima oportunidade para que sejam desenvolvidas novas abordagens para construção automática de algoritmos de aprendizado de máquina. Nesse contexto, o presente projeto propõe o desenvolvimento de algoritmos evolutivos de programação genética e evolução gramatical como híper-heurísticas para construção automática de algoritmos de indução de árvores de decisão. Adicionalmente, o presente projeto visa também contribuir na construção automática de design components específicos de algoritmos top-down de indução de árvores de decisão, tais como funções de split e métricas utilizadas em métodos de poda (pruning).
Autores: Márcio Porto Basgalupp
Desde 2014
-
Construção automática de medidas de split para indução de árvores de decisão
Árvores de Decisão constituem uma técnica poderosa e amplamente utilizada em tarefas de mineração de dados. Geralmente, algoritmos de indução de árvores de decisão usam uma estratégia gulosa, top-down e com particionamento recursivo dos conjuntos de dados para a construção das árvores. Uma das questões chave dos algoritmos top-down para indução de árvores de decisão é a escolha do(s) melhor(es) atributo(s) para dividir um conjunto de dados em subconjuntos de acordo com a medida de split empregada. A literatura dispõe de uma grande quantidade de trabalhos que são dedicados ao projeto e à investigação de novas medidas de split, no entanto, até onde se sabe, todas essas medidas foram propostas por humanos, manualmente. Por outro lado, algoritmos de Programação Genética (PG) têm sido empregados para construção automática de funções matemáticas em várias aplicações, e têm cada vez mais se mostrado capaz de produzir automaticamente funções similares e até melhores que o seres-humanos. No entanto, não foi encontrado na literatura nenhum trabalho que evolua funções matemáticas que representem medidas de split para construção de árvores de decisão. Nesse contexto, este projeto propõe o desenvolvimento de um algoritmo de Programação Genética, em particular baseada em gramática (GGP, do inglês Grammar-based Genetic Programming) para a construção automática de medidas de split a serem incorporadas nos principais algoritmos top-down de indução de árvores de decisão.
Autores: Márcio Porto Basgalupp, Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, Alex A. Freitas, Barros, Rodrigo C., DA SILVA, TIAGO S., Gisele Lobo Pappa
2013 a 2016
-
Projeto automatizado de meta-heurísticas para otimização global
Ao longo dos últimos anos, diversas meta-heurísticas têm sido propostas para a resolução de vários tipos de problemas. Em geral, as meta-heurísticas utilizam operações que combinam soluções atuais para gerar novas soluções com o intuito de encontrar soluções cada vez melhores ao longo das iterações. Uma maneira de melhorar o desempenho de meta-heurísticas é desenvolver novos procedimentos operadores explorem melhor o espaço de pesquisa e evitem ou escapem de regiões denominadas ótimos locais. Outra possibilidade é adicionar estratégias para que as meta-heurísticas sejam adaptativas, alterando seu comportamento automaticamente ao longo do processo de otimização. O desenvolvimento desses novos componentes (procedimentos operadores e estratégias adaptativas) é uma tarefa difícil que requer um grande esforço dos pesquisadores, podendo levar dias, semanas ou meses. Essa tarefa geralmente exige criatividade e conhecimento de fundo do pesquisador para identificar alguma informação extra que possa melhorar o desempenho da meta-heurística. Depois de identificada, essa informação deve ser inserida de alguma maneira que seja eficaz na criação de soluções de melhor qualidade, o que também pode requerer grande esforço e criatividade do pesquisador. Caso essa nova informação seja empregada de maneira inadequada, a alteração pode, inclusive, apresentar resultados inferiores aos daqueles gerados sem ela. Por esses motivos, uma linha de pesquisa tem sido cada vez mais investigada nos últimos anos: hiper-heurísticas. Com técnicas dessa natureza é possível automatizar a criação de algoritmos diversos, tirando do pesquisador a tarefa de encontrar essa melhoria por meio de tentativa e erro. Face ao exposto, neste projeto objetiva-se desenvolver uma ferramenta para auxiliar no projeto automatizado de meta-heurísticas para otimização global. Contudo, em vez de fazer seleção automática de componentes previamente criados e codificados, como é comumente empregado na literatura, a ferramenta proposta para este projeto deverá ser capaz de criar códigos, substituindo parte do trabalho manual que o pesquisador precisa fazer na composição do componente, experimentação e avaliação de resultados. As meta-heurísticas resultantes poderão superar significativamente as meta-heurísticas originais, trazendo ganhos consideráveis na resolução de problemas de otimização.
Autores: Márcio Porto Basgalupp, Vinícius Veloso de Melo, Grazieli Luiza Costa Carosio, Alexandre Cláudio Botazzo Delbem
2013 a 2017
-
Automatic Design of Decision-Tree Induction Algorithms for Detecting Patterns of Functional Gene-Gene Interactions in Observational Gene Expression Data
Predicting an organism?s or a cell?s response to a therapeutical intervention lies at the heart of medical research. In a functional cellular experiment, one can intervene in the expression of a gene x using RNA interference technologies and collect the downstream effects in the entire transcriptome using high throughput technologies like microarrays or RNAseq. This experiment gives us a class of genes that respond to the intervention in x (class A) and a class of genes that do not (class B). We hypothesize that also observational data that does not involve perturbations of gene x holds information whether a gene is in class A or B, since the biological mechanisms that drive the expression of these classes of genes must be different. This yields a standard classification problem: Predict whether a gene belongs to a class A or B by considering only observational data. In this project, we will investigate machine learning-based solutions to this problem by evolving decision tree induction algorithms. Decision tree induction is one of the most employed methods to extract knowledge from data, since the representation of knowledge is very intuitive and easily understandable by humans. The most successful strategy for inducing decision trees, the greedy top-down approach has been continuously improved by researchers over the years. This work, following recent breakthroughs in the automatic design of machine learning algorithms, proposes a hyper-heuristic evolutionary algorithm for automatically generating decision-tree induction algorithms, named HEAD-DT. We will automatically design a decision tree induction algorithm tailored to tdetecting functional gene-gene interactions from observational gene expression data. The designed algorithm and its induced classifiers may be a first step to develop a platform for ?virtual intervention experiments? that could be used to prioritize genes for further biological experimental studies.
Autores: Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, Barros, Rodrigo C., Tiago S. da Silva, Rainer Spang
2013 a 2015
-
Aprendizado Semi-Supervisionado Dinâmico Baseado em Grafos
O desenvolvimento de técnicas que possam "aprender" com base na observação do ambiente é um dos grandes objetivos da área de Aprendizado de Máquina. Para a construção de classificadores, as técnicas tradicionais de aprendizado de máquina necessitam de uma grande quantidade de dados rotulados a fim de induzir um bom classificador. Estes dados rotulados são geralmente caros de serem obtidos, principalmente quando envolvem a rotulação manual por parte de um especialista. Por outro lado, a aquisição de dados não rotulados pode ser uma tarefa simples em diversos domínios. Recentemente, uma nova vertente da área de aprendizado de máquina, denominada aprendizado semi-supervisionado, tem se destacado como uma linha bastante promissora. Esta forma de aprendizado utiliza tanto dados rotulados como dados não rotulados na geração de classificadores. Outro tópico importante relacionado ao tratamento de dados está na forma dinâmica como esses podem são obtidos, pois, no mundo real, os dados não são estáticos, mas sofrem alterações continuamente. Nesse contexto, este projeto tem como objetivo principal o desenvolvimento de novos modelos de aprendizado semi-supervisionado capazes de tratar dados dinâmicos sem a necessidade de um processo de reaprendizagem. Como base para o desenvolvimento desta pesquisa, alguns modelos com dinâmica espaço-temporal em grafos, como a sincronização de neurônios e a competição de partículas, serão considerados..
Autores: Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, Barros, Rodrigo C., Tiago S. da Silva, Rainer Spang, Márcio Porto Basgalupp, Zhao Liang, Marcos G. Quiles, Elbert Macau
2011 a 2013
-
Aprendizado Semi-Supervisionado Dinâmico e Ativo Baseado em Redes Complexas
Este projeto tem como objetivo principal o desenvolvimento de novas técnicas de aprendizado semi-supervisionado baseadas em redes para conjuntos de dados dinâmicos. Para o desenvolvimento dessas técnicas, serão utilizadas propriedades das redes complexas que representarão os dados e modelos computacionais dinâmicos para propagação dos rótulos. Das redes complexas serão extraídas medidas a serem utilizadas como parâmetros de seleção de vértices. Essa seleção terá duas finalidades: indicar ao especialista quais exemplos necessitam de rotulação (aprendizado ativo) e a quais vértices da rede os novos exemplos serão conectados (crescimento dinâmico da rede). A propagação dos rótulos na rede (classificação semi-supervisionada) será realizada por modelos computacionais dinâmicos, com enfoque nos modelos de competição de partículas e modelos de sincronização de neurônios. A partir dos estudos realizados ao longo deste projeto e com o desenvolvimento das novas técnicas, espera-se gerar contribuições originais em três linhas: 1) uma proposta de representação em redes de conjuntos de dados dinâmicos; 2) desenvolvimento de técnicas capazes de tratar dados dinâmicos; e 3) utilização do aprendizado ativo utilizando propriedades das redes complexas como forma de otimizar o trabalho do especialista no processo de rotulação.
Autores: Márcio Porto Basgalupp, Zhao Liang, Marcos G. Quiles
2012 a 2017
-
Programação Genética para evolução de algoritmos de indução de árvores de decisão
Árvores de Decisão constituem uma técnica poderosa e amplamente utilizada em tarefas de mineração de dados. Geralmente, algoritmos de indução de árvores de decisão usam uma estratégia gulosa, \emph{top down} e com particionamento recursivo para a construção das árvores. No entanto, há pelo menos dois problemas relacionados a essas características: (i) estratégias gulosas geralmente produzem soluções ótimas locais ao invés de globais, (ii) particionamento recursivo degrada iterativamente a qualidade do \emph{dataset} e, consequentemente, a qualidade dos resultados obtidos. Para lidar com essas dificuldades, diferentes abordagens foram sugeridas, tais como \emph{Options Trees}, \emph{ensembles} (ex: \emph{boosting} e \emph{bagging}), e algoritmos evolutivos. No entanto, tais algoritmos evolutivos são usados para evoluir árvores de decisão específicas para cada problema de classificação, e não para evoluir algoritmos genéricos para indução de árvores de decisão para qualquer problema de classificação. Uma das subáreas de algoritmos evolutivos, a Programação Genética (PG) é uma ferramenta adequada para evoluir programas de computadores. Um programa evoluído por Programação Genética pode produzir a mesma solução desenvolvida por um humano para solucionar um problema, mas também pode produzir algo completamente diferente e talvez melhor. Nesse contexto, o objetivo deste projeto é estudar programação genética com o intuito de utilizá-la para evoluir algoritmos de indução de árvores de decisão. A ideia é evoluir algoritmos genéricos para indução de árvores de decisão, ou seja, o resultado final da PG será um algoritmo de indução árvores de decisão, e não apenas uma árvore de decisão. Nesse sentido, pode-se considerar um algoritmo de \emph{meta-learning}, pois o objetivo é aprender um algoritmo de aprendizagem.
Autores: Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, Rodrigo Coelho Barros, Alex A. Freitas, Marcos G. Quiles, Vili Podgorelec
2011 a 2015
Universidade de São Paulo
Universidade Federal de São Carlos
-
Evolução automática de redes neurais profundas
Atualmente, as redes neurais profundas (RNPs) são o estado-da-arte para a solução de problemas difíceis. Seus resultados notáveis dependem diretamente de aspectos como arquitetura e hiperparâmetros. O projeto manual de uma RNP requer conhecimento especializado e muita tentativa e erro, especialmente conforme a dificuldade do problema aumenta. Várias abordagens foram desenvolvidas para otimizar automaticamente arquiteturas e hiperparâmetros de RNPs, em uma área de pesquisa moderna chamada neuroevolução. Porém, a maioria delas se concentra em partes específicas do projeto de RNPs, como hiperparâmetros, topologia ou pesos, e não considera módulos de microarquitetura, também conhecidos como arquiteturas de Rede em Rede (ReR). Assim, neste projeto, propomos novos métodos baseados em Algoritmos Evolutivos baseados em Gramática para evoluir automaticamente arquiteturas de RNPs e seus hiperparâmetros, considerando as contribuições mais recentes do estado-da-arte, como as arquiteturas ReR.
Autores: Márcio Porto Basgalupp, Ricardo Cerri, MIRANDA, THIAGO ZAFALON
Desde 2020
-
Classificação Hierárquica de Elementos Transponíveis Utilizando Aprendizado de Máquina
Elementos Transponíveis (TEs) são sequências de DNA que podem se mover de um local para outro dentro do genoma de uma célula. Eles contribuem para a diversidade genética das espécies, e seus mecanismos de transposição podem afetar a funcionalidade dos genes. A correta identificação e classificação de TEs é útil para a compreensão de seus efeitos no processo evolutivo dos genomas. Os TEs são organizados em uma taxonomia hierárquica, com famílias e superfamílias. Geralmente, a identificação e classificação de TEs é realizada por meio de ferramentas de Bioinformática que utilizam homologia, comparando uma sequência com várias sequências de um conjunto de dados com TEs já identificados. Esse método apresenta limitações, pois a homologia entre sequências ignora as propriedades bioquímicas das mesmas, e também os relacionamentos hierárquicos entre as diferentes famílias e superfamílias de TEs. Assim, neste projeto, serão investigados e propostos diferentes métodos de classificação hierárquica de TEs utilizando Aprendizado de Máquina (AM). Inicialmente, diferentes conjuntos de dados serão construídos com sequências de nucleotídeos e de aminoácidos já com TEs previamente identificados. Para a construção desses conjuntos de dados, serão utilizadas ferramentas de Bioinformática desenvolvidas para extrair características bioquímicas de sequências, e também diferentes estratégias para conversão de sequências em valores de atributos adequados para a utilização em técnicas de AM. Os conjuntos de dados serão, então, estruturados hierarquicamente, de acordo com as famílias e superfamílias de TEs a que pertencem. Os métodos de classificação propostos serão comparados com métodos existentes na literatura, e avaliados por meio de medidas de avaliação específicas para problemas de classificação hierárquica.
Autores: Márcio Porto Basgalupp, André C. P. L. F. de Carvalho, CERRI, RICARDO, Carlos Norberto Fischer
2016 a 2018
Universidade Federal de Pernambuco
Atualização Lattes em 2024-06
Processado em 2024-07-22