Uma metodologia para o desenvolvimento de Wordnets terminológicas em português do Brasil
DOI :
https://doi.org/10.11606/issn.2317-9511.tradterm.2010.46325Mots-clés :
Terminologia, PLN, Base de dados, Wordnet, TermiNet.Résumé
Para o desenvolvimento de vários sistemas computacionais que processam língua natural (p.ex., sistemas de sumarização, sistemas de tradução automática etc.), os pesquisadores da área do Processamento Automático das Línguas Naturais (PLN) necessitam de certos recursos linguísticos (os lingwares), os quais desempenham papel central na arquitetura desses sistemas, p.ex.: as “bases de conhecimento lexical”. Dada a necessidade crescente de se processar textos especializados, bases de conhecimento lexical especializado (ou terminológico) passaram a ser desenvolvidas para várias línguas, principalmente no formato wordnet. Ocorre que, embora exista um número razoável de wordnets terminológicas em diversas línguas, observa-se a carência de uma metodologia suficientemente clara que facilite e, sobretudo, estimule a criação dessas bases. Para o português do Brasil (PB), aliás, não há bases de conhecimento especializado no formato wordnet. Nesse cenário, está sendo desenvolvido o projeto TermiNet (do inglês, terminological wordnet), que objetiva: (i) a instanciação (ou seja, versão mais definida), para o desenvolvimento específico de wordnets terminológicas, da metodologia genérica de pesquisa no PLN proposta por Dias-da-Silva (2006) e (ii) a sua aplicação na construção de uma base desse tipo em PB. Acredita-se que o TermiNet pode beneficiar não só o PLN, mas também a Terminologia/ Terminografia em PB, pois o formato wordnet é um modelo robusto e eficaz para a sistematização do conhecimento léxico-conceitual, fundamental também para o desenvolvimento de produtos terminográficos tradicionais. Neste artigo, em especial, apresenta-se o referido projeto, focalizando a primeira etapa das atividades, que é a instanciação da metodologia trifásica de Dias-da-Silva (2006).##plugins.themes.default.displayStats.downloads##
##plugins.themes.default.displayStats.noStats##
Téléchargements
Publiée
2010-06-18
Numéro
Rubrique
Artigos
Licence
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution BY-NC-SA que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
Comment citer
Di Felippo, A., & Almeida, G. M. de B. (2010). Uma metodologia para o desenvolvimento de Wordnets terminológicas em português do Brasil. Tradterm, 16, 365-395. https://doi.org/10.11606/issn.2317-9511.tradterm.2010.46325