A Linguística Computacional estuda as Tecnologias da Linguagem Humana numa perspetiva linguística. A disciplina tem como objetivos introduzir os alunos em distintos módulos (e.g., fala, texto, tradução, linguagem gestual, deteção de emoções e outros eventos paralinguísticos, sistemas de diálogos e assistentes virtuais), reconhecer, avaliar e discutir  os modelos linguísticos aplicados a sistemas de Inteligência Artificial (IA). A disciplina procura desenvolver o espírito crítico linguístico sobre o uso e avaliação das tecnologias numa era de IA.


Objetivos:

1. Contactar com tecnologias de Processamento Automático de Fala e de Língua Natural e interagir com as referidas tecnologias numa perspetiva de análise linguística. 

2. Analisar as estruturas linguísticas desafiantes para os diferentes sistemas automáticos apresentados. 

3. Discutir a importância da Linguística Computacional na era da Inteligência Artificial


Conteúdos:

A estrutura modular da disciplina corresponderá aos seguintes módulos: 

1. Definição do conceito de Linguística Computacional e áreas de aplicação. 

2. Processamento Automático de Fala (PAF) e Síntese de Fala (SF). 

3. Processamento de Linguagem Natural (PLN): processadores de texto, analisadores morfossintáticos e sistemas de Compreensão de Linguagem Natural. 

4. Sistemas de diálogo e mecanismos de sintonia entre falantes. 

5. Projetos de investigação e aplicações.

Os diversos módulos terão sempre por base o conhecimento linguístico de fala e de escrita, seguidamente serão apresentadas tecnologias amplamente usadas nos dias de hoje que processam fala, texto e multimodalidade. Os alunos irão testar as diferentes tecnologias e procurar problematizar as estruturas linguísticas desafiantes para os sistemas testados.

Esta UC pretende apresentar uma panorâmica de distintos módulos de PLN e  RAF, para que os(as) alunos(as)  possam ter uma visão abrangente da área e possam escolher o módulo que mais lhes interessar para o desenvolvimento do projeto de investigação. Desta forma, tecnologias da linguagem, tanto fala, texto, como multimodais, serão abordadas e discutidas em aula.

Avaliação:

A avaliação é contínua e a classificação é baseada na média ponderada dos seguintes elementos de avaliação obrigatórios: trabalhos de projeto práticos desenvolvidos em aula (50%); 1 teste escrito final (40%); participação relevante em aula (10%). Dada a relevância do trabalho aplicado, a UC prevê que 50% da nota total seja a demonstrar a capacidade de interagir e avaliar sistemas de forma discutida.

A UC conta com a presença a convite de estudiosos de Processamento de Linguagem Natural e de Processamento Automático de Fala, bem como de estagiários de Mestrado em Linguística e de linguistas computacionais a trabalharem em distintas empresas. Pretende-se que, com as aulas a convite, os alunos possam perceber como aplicar o conhecimento da aula a contextos reais e ecológicos de uso de tecnologias que aliam o conhecimento linguístico à Inteligência Artificial.

Esta UC procura fomentar a aprendizagem por projeto, investigação e abordagens orientadas à resolução autónoma de problemas, com base em aulas práticas, com enquadramento teórico. Como todos os conteúdos programáticos requerem uma análise cuidada de dados, a importância de dados de qualidade para treino, desenvolvimento e teste dos sistemas é transversal a todos os conteúdos. Para além da temática da importância dos dados, as questões éticas associadas à área de Inteligência Artificial procuram sensibilizar os alunos para discussões de estado de arte sobre tecnologias de Inteligência Artificial Responsáveis que assistam eticamente os seres humanos.

Os alunos têm aulas teóricas, que promovem a aquisição de terminologia da área e o enquadramento dos problemas a testar, com base em exemplos e demonstrações experimentais ou computacionais, sendo que, embora teóricas, perdem o caráter exaustivo da teoria pelos exemplos, demonstrações e vídeos de autores de referência da área com exemplos concretos. As aulas intercalam entre teoria e prática ou vice-versa, para fomentar trabalho autónomo. Estas são sobretudo orientadas à resolução de problemas, em grupos, a pares ou individualmente, com base em estratégias de aprendizagem ativa (e.g., sumariação autónoma das etapas do problema,  dos testes efetuados e da sistematização de estruturas analisadas e principais resultados). As estratégias passam pela corresponsabilização e autonomia do aluno, para tal contribuem as sistematizações coletivas com base nas experiências realizadas. O espaço de aula é deixado  em aberto para novas questões/estruturas que os alunos queiram averiguar.

Os seminários de investigadores convidados e de linguistas computacionais estagiários (e.g., Defined.ai, ELSA, Unbabel, VoiceInteraction) ou já linguistas computacionais com experiência pretendem mostrar a articulação entre o trabalho desenvolvido em aula e aplicações reais em diversas indústrias e projetos de investigação. Pretende-se, assim, aliciar os(as) alunos(as) para futuros trabalhos no Mestrado em Linguística e para o mercado de trabalho que conjuga Linguística Computacional e Inteligência Artificial.

Bibliografia:

Jurafsky, Dan & James Martin. 2019. Speech and Language Processing: An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition, 3rd edition. Prentice Hall.

Mamede, Nuno, Jorge Baptista, Cláudio Dinis & Vera Cabarrão. 2012. STRING: an hybrid statistical and rule- based natural language processing chain for Portuguese, PROPOR 2012. Coimbra.

Mata, Ana Isabel & Helena Moniz. 2016. Prosódia, variação e processamento automático, in Ana Maria Martins & Ernestina Carrilho (eds.), Manual de Linguística Portuguesa Berlim: De Gruyter.

Moniz, Helena & Carla Parra-Escartín (eds.) 2021. Towards Responsible Machine Translation: Ethical and Legal consideration on Machine Translation. Springer Nature. 

Raposo, E. P., M. F. Bacelar do Nascimento, M. A. Coelho da Mota, L. Segura & A. Mendes, (eds.). 2013. Gramática do Português. Lisboa: Fundação Calouste Gulbenkian.