Processamento de Linguagem Natural - Similaridade Semântica

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 23

PROCESSAMENTO DE LINGUAGEM NATURAL

Similaridade Semântica
TÓPICOS

1. Introdução
2. Semântica
3. Similaridade Semântica
4. Estado da arte

2
LINGUAGENS

• O que é a linguagem?

“Sistema de símbolos de um vocabulário que, quando


colocados numa determinada ordem e expressos num
determinado contexto, emitem um significado.”
PLN

• Quão difícil é processar automaticamente a


linguagem natural?

Análise Semântica
Semântica Lexical
NÍVEIS LINGUÍSTICOS

• Semântica
• Estudo dos significados
• Semântica lexical
• Entendimento do significado das unidades
linguísticas (ex.: escola e ônibus)
• Semântica composicional
• Entendimento do significado de unidades que
se agrupam em uma frase (ex.: escola de
inglês)
SEMÂNTICA LEXICAL

• Polissemia
• Quando a mesma palavra tem significados
relacionados
• Ex.: “letra”
• Homonímia
• Quando a mesma palavra tem significados não
relacionados
• Ex.: “manga”
SEMÂNTICA LEXICAL

• Relações
• Sinonímia
• cômico ~ engraçado
• palavra ~ vocábulo
• Antonímia
• bom ~ ruim
• amar ~ odiar
SEMÂNTICA LEXICAL

• Relações
• Hiperonímia / Hiponímia
• fruta → maçã
• veículo → carro é-um is-a
• Holonímia / Meronímia
• carro // roda
• cadeira // pé parte-de part-of
SEMÂNTICA COMPOSICIONAL

• O que é?
• O significado de uma sentença depende dos itens
lexicais que a compõem
• O significado de uma MWE composicional
depende dos itens lexicais que a compõem
• Princípio de Composicionalidade
• O significado de um constituinte sintático é
derivado exclusivamente do significado de seus
constituintes imediatos
SEMÂNTICA COMPOSICIONAL

• Formalismos de representação
• Lógica de Primeira Ordem
• Predicados + Variáveis + Quantificadores +
Conectivos lógicos determinam a
semântica
• Ex.: O menino foi para a escola de ônibus.
• ir(menino, escola) ^ modo(ir, ônibus)
SEMÂNTICA COMPOSICIONAL

• Formalismos de representação
• Abstract Meaning Representation
The boy wants the girl to believe him.
The boy wants to be believed by the girl.

Fonte: https://medium.com/@sroukos/semantic-parsing-using-abstract-meaning-
representation-95242518a380
SIMILARIDADE TEXTUAL

• Similaridade: verificar o quão “próximos” são dois


fragmentos de texto a partir do (1) significado e de sua
(2) estrutura
• (1) similaridade semântica
• (2) similaridade léxica

• Medidas vistas na semana 2


• Similaridade textual / léxica
SIMILARIDADE SEMÂNTICA

• Abordagem baseada em ontologias


• Abordagem baseada no índice de informações
compartilhadas
• Abordagem baseada em características
• Abordagem híbrida (algum tipo de combinação
das três anteriores)
BASEADA EM ONTOLOGIAS

• Ontologia: é um sistema de descrição abstrata que


entende a constituição de conhecimento de certo
domínio pela organização de conceitos de maneira
hierárquica, descrevendo os relacionamentos entre
os conceitos usando um número pequeno de
descritores relacionais e vocabulário padronizado
para representar as entidades do domínio.

• A similaridade semântica entre palavras é medida


com base em recursos semânticos explorando o
conhecimento existente dentro desses recursos.
WORDNET

• A WordNet é o recurso de ontologia mais popular e amplamente


utilizado na medição de similaridade baseada em conhecimento.

• Grande banco de dados léxicos de um projeto de pesquisa desenvolvido


pela Univ. de Princeton que organiza substantivos, verbos, advérbios e
adjetivos em um conceito de relações semânticas,
chamado de conjuntos de sinônimos.
SIMILARIDADE SEMÂNTICA

• Ontologias
• Baseadas em arestas: Pekar et al., Cheng and Cline, Wu et al. ...
• Baseadas em nó: Resnik, Lin, Maguitman, Menczer, Roinestad and
Vespignani, Jiang and Conrath, Align, Disambiguate, and Walk
• Pairwise
• Groupwise
• Estatísticas: LSA, PMI, NGD, SSA, SimRank...
• Semantics-based similarity
• Semantics Similarity Networks
• https://en.wikipedia.org/wiki/Semantic_similarity
ESTADO DA ARTE

• Transformers para codificar


sentenças e obter seus
embeddings e, em seguida,
usar uma métrica de
similaridade (por exemplo,
similaridade de cosseno)
para calcular sua pontuação
de similaridade.

• SBERT – Sentence-Transformers
https://www.sbert.net/docs/usage/semantic_textual_similarity.html
CALCULANDO SIMILARIDADE
Colab - SBERT
CALCULANDO SIMILARIDADE
Colab - SBERT
CALCULANDO SIMILARIDADE
Colab - SBERT
O QUE VIMOS?

• Introdução
• Semântica
• Similaridade Semântica
• Estado da arte

21
PRÓXIMA VIDEOAULA

• Análise de Sentimentos

22
REFERÊNCIAS

• Curso de Processamento de Linguagem Natural


• Profa. Helena Caseli (UFSCar)

• Curso de Processamento de Linguagem Natural


• Prof. Thiago Pardo (ICMC-USP)

Você também pode gostar