Sumários

Corpus: opções de pesquisa

6 Fevereiro 2024, 08:00 Amália Mendes

Opções de pesquisa:
- palavra
- lema
- wildcards 

Opções de visualização das concordâncias:
- sort (ordenação)
- thin (amostragem aleatória): determinar o número de contextos que podem ser analisados (número ou percentagem)

Opções com informação adicional sobre as concordâncias:
- Distribution (por tipo de texto e por variedade do português)
- Frequency breakdown (diferentes unidades lexicais obtidas por uma pesquisa)


Organização das apresentações orais a realizar pelos alunos.

5 Fevereiro 2024, 17:00 Ana Isabel Mata da Silva

Início da organização das apresentações orais a realizar pelos alunos sobre textos com trabalho de investigação relevante para a UC: apresentação da lista de textos disponíveis até à Páscoa; breve resumo de temas a trabalhar; indicação de regras a seguir; marcação da apresentação oral de diferentes grupos.


Instrumentos para a normalização linguística: gramáticas, dicionários e recursos ortográficos

2 Fevereiro 2024, 12:30 Marisa Alexandra Sousa da Cruz

Instrumentos para a normalização linguística verbal e não verbal (Língua Gestual Portuguesa).
Análise exploratória (e comparativa) de alguns recursos, disponíveis em papel e online: estrutura e conteúdos.


Corpus: metadados, tokenização e lematização

1 Fevereiro 2024, 08:00 Amália Mendes

CRPC:

standard query 
restricted query
concordâncias, KWIC

obter metadados dos contextos
referir os contextos de corpus em trabalhos académicos

tokenização do corpus: conceito de token e opções de tokenização

lematização: pesquisa por lema



Tipos e funções de dados linguísticos: conclusão das aulas anteriores.

31 Janeiro 2024, 17:00 Ana Isabel Mata da Silva

Conclusão das aulas anteriores: dados sistemáticos e não sistemáticos; dados de corpora e dados de elicitação na investigação em Linguística - vantagens e desvantagens. Distribuição de trabalho prático.