Sumários

Aula lecionada pela Doutora Vera Cabarrão: o percurso de uma linguista computacional.

20 Setembro 2023, 14:00 Helena Gorete Silva Moniz

Aula lecionada pela Doutora Vera Cabarrão: o percurso de uma linguista computacional.


Visualização de vídeos de Dan Jurafsky com a definição de Processamento de Linguagem Natural (PLN), exemplos e implicações éticas e sociais de PLN.

18 Setembro 2023, 14:00 Helena Gorete Silva Moniz

Visualização de vídeos de Dan Jurafsky com a definição de Processamento de Linguagem Natural (PLN), exemplos e implicações éticas e sociais de PLN:


Olhar panorâmico sobre a Linguística Computacional: o que faz um linguista computacional?

13 Setembro 2023, 14:00 Helena Gorete Silva Moniz

Olhar panorâmico sobre a Linguística Computacional: o que faz um linguista computacional?


Apresentação da professora, alunos e UC

11 Setembro 2023, 14:00 Helena Gorete Silva Moniz

A Linguística Computacional estuda as Tecnologias da Linguagem Humana numa perspetiva linguística. A disciplina tem como objetivos introduzir os alunos em distintos módulos (e.g., fala, texto, tradução, linguagem gestual, deteção de emoções e outros eventos paralinguísticos, sistemas de diálogos e assistentes virtuais), reconhecer, avaliar e discutir  os modelos linguísticos aplicados a sistemas de Inteligência Artificial (IA). A disciplina procura desenvolver o espírito crítico linguístico sobre o uso e avaliação das tecnologias numa era de IA.


Objetivos:

1. Contactar com tecnologias de Processamento Automático de Fala e de Língua Natural e interagir com as referidas tecnologias numa perspetiva de análise linguística. 

2. Analisar as estruturas linguísticas desafiantes para os diferentes sistemas automáticos apresentados. 

3. Discutir a importância da Linguística Computacional na era da Inteligência Artificial


Conteúdos:

A estrutura modular da disciplina corresponderá aos seguintes módulos: 

1. Definição do conceito de Linguística Computacional e áreas de aplicação. 

2. Processamento Automático de Fala (PAF) e Síntese de Fala (SF). 

3. Processamento de Linguagem Natural (PLN): processadores de texto, analisadores morfossintáticos e sistemas de Compreensão de Linguagem Natural. 

4. Sistemas de diálogo e mecanismos de sintonia entre falantes. 

5. Projetos de investigação e aplicações.

Os diversos módulos terão sempre por base o conhecimento linguístico de fala e de escrita, seguidamente serão apresentadas tecnologias amplamente usadas nos dias de hoje que processam fala, texto e multimodalidade. Os alunos irão testar as diferentes tecnologias e procurar problematizar as estruturas linguísticas desafiantes para os sistemas testados.

Esta UC pretende apresentar uma panorâmica de distintos módulos de PLN e  RAF, para que os(as) alunos(as)  possam ter uma visão abrangente da área e possam escolher o módulo que mais lhes interessar para o desenvolvimento do projeto de investigação. Desta forma, tecnologias da linguagem, tanto fala, texto, como multimodais, serão abordadas e discutidas em aula.

Avaliação:

A avaliação é contínua e a classificação é baseada na média ponderada dos seguintes elementos de avaliação obrigatórios: (i) Projeto 1 (20%); (ii) Projeto 2 (20%); iii) trabalho final a apresentar à turma (50%) e (iv) participação relevante em aula (10%).

A UC conta com a presença a convite de estudiosos de Processamento de Linguagem Natural e de Processamento Automático de Fala, bem como de estagiários de Mestrado em Linguística e de linguistas computacionais a trabalharem em distintas empresas. Pretende-se que, com as aulas a convite, os alunos possam perceber como aplicar o conhecimento da aula a contextos reais e ecológicos de uso de tecnologias que aliam o conhecimento linguístico à Inteligência Artificial.

Esta UC procura fomentar a aprendizagem por projeto, investigação e abordagens orientadas à resolução autónoma de problemas, com base em aulas práticas, com enquadramento teórico. Como todos os conteúdos programáticos requerem uma análise cuidada de dados, a importância de dados de qualidade para treino, desenvolvimento e teste dos sistemas é transversal a todos os conteúdos. Para além da temática da importância dos dados, as questões éticas associadas à área de Inteligência Artificial procuram sensibilizar os alunos para discussões de estado de arte sobre tecnologias de Inteligência Artificial Responsáveis que assistam eticamente os seres humanos.

Os alunos têm aulas teóricas, que promovem a aquisição de terminologia da área e o enquadramento dos problemas a testar, com base em exemplos e demonstrações experimentais ou computacionais, sendo que, embora teóricas, perdem o caráter exaustivo da teoria pelos exemplos, demonstrações e vídeos de autores de referência da área com exemplos concretos. As aulas intercalam entre teoria e prática ou vice-versa, para fomentar trabalho autónomo. Estas são sobretudo orientadas à resolução de problemas, em grupos, a pares ou individualmente, com base em estratégias de aprendizagem ativa (e.g., sumariação autónoma das etapas do problema,  dos testes efetuados e da sistematização de estruturas analisadas e principais resultados). As estratégias passam pela corresponsabilização e autonomia do aluno, para tal contribuem as sistematizações coletivas com base nas experiências realizadas. O espaço de aula é deixado  em aberto para novas questões/estruturas que os alunos queiram averiguar.

Os seminários de investigadores convidados e de linguistas computacionais estagiários (e.g., Defined.ai, ELSA, Unbabel, VoiceInteraction) ou já linguistas computacionais com experiência pretendem mostrar a articulação entre o trabalho desenvolvido em aula e aplicações reais em diversas indústrias e projetos de investigação. Pretende-se, assim, aliciar os(as) alunos(as) para futuros trabalhos no Mestrado em Linguística e para o mercado de trabalho que conjuga Linguística Computacional e Inteligência Artificial.

Bibliografia:

Clark, A., Fox, C. & Lappin, S. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Wiley-Blackwell, disponível em http://course.duruofei.com/wp-content/uploads/2015/05/Clark_Computatio nal-Linguistics-and-Natrual-Language-Processing.pdf

Jurafsky, D. & Martin, J. (2023). Speech and Language Processing – An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, third edition. New Jersey: Prentice Hall, disponível em https://web.stanford.edu/~jurafsky/slp3/ed3book_jan72023.pdf

Mitrov, R. (2014). The Oxford Handbook of Computational Linguistics, second edition, Oxford, Oxford University Press.

Moniz, H. & Parra Escartín, C. (2023). Towards Responsible Machine Translation: Legal and Ethical Considerations in Machine Translation. Springer, Machine Translation: Technologies and Applications series.