Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/19225
Type: | Trabalho de conclusão de graduação |
Title: | Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
Other Titles: | Classification of massive stars with unsupervised machine learning |
Author(s)/Inventor(s): | Gonçalves, Rodrigo Barros |
Advisor: | Marcolino, Wagner Luiz Ferreira |
Abstract: | A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores. |
Keywords: | Astrofísica estelar Estrelas de alta massa Classificação espectral de estrelas Aprendizado de máquina Algorítmos Python (Linguagem de programação de computador) Stellar astrophysics Massive Stars Stellar spectral classification Machine Learning Algorithms |
Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA |
Production unit: | Observatório do Valongo |
Publisher: | Universidade Federal do Rio de Janeiro |
Issue Date: | 17-Oct-2022 |
Publisher country: | Brasil |
Language: | por |
Right access: | Acesso Aberto |
Citation: | GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022. |
Appears in Collections: | Astronomia |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
RBGonçalves.pdf | 3.56 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.