ANALISI $L R (K)$

L’ analisi LL(k), costruendo l’albero top-down, necessita di dedurre la prossima mossa da intraprendere osservando i prossimi $k$ simboli di input, di conseguenza risulta utile solo nel caso di linguaggi con $k = 1$ (nel caso dell’assegnamento $k = 2$ )

L’analisi $L R$ invece ribalta il paradigma ricostruendo l’albero in bottom-up

flowchart LR
subgraph LL
A{SCOPO}
B[frase da riconoscere]
A --produzioni--> B
end
subgraph LR
C{SCOPO}
D[frase da riconoscere]
D --produzioni--> C
end
LL ~~~ LR

Questo approccio rende l’analisi LR si più potente, infatti l’ insieme dei linguaggi contex free riconoscibili per mezzo dell’analisi LL e contenuto in quelli riconoscibili per mezzo dell’ analisi LR.

Tuttavia l’analisi LR risulta più complessa da progettare e computazionalmente più esosa, esistono quindi tecniche che approssimano l’analisi LR come SLR o LALR

ARCHITETTURA DI UN PARSER $L R$

Un parser $R L$ ricostruisce l’albero di derivazione della frase in analisi al contrario, di conseguenza necessita di comprendere quando sia necessario fare:

un operazione di SHIFT ovvero leggere da input un altro valore (aggiungere all’albero una foglia)
un operazione di REDUCE ovvero applicare al contrario una produzione (costruire un nodo padre da 1 o più nodi figli)

La decisione viene presa in base a un contesto corrente (stato) in cui il riconoscitore si trova a operare

Il componente software imputato di tale compito e il RICONOSCITORE DI CONTESTI

ANALISI $L R (0)$

Nel caso dell’analisi $L R$ e utile partire con il caso in cui $k = 0$ ovvero non ci sono informazioni sul futuro, che nel caso dell’ analisi LL non aveva senso ma nel caso dell’analisi $L R$ si ha sempre l’informazione di contesto che può guidare il parser

CONTESTI $L R (0)$

Vengono di conseguenza definiti i contesti $L R (0)$ :

data una produzione della forma $A \to α$ l’inseme dei contesti $L R (0)$ e cosi definito

L R (O) c t x (A \to α) = {γ ∣ γ = β α, Z \Rightarrow * β A w \Rightarrow β α w, co n w \in V T^{*}}

ovvero tutti i simboli che possono comparire a sinistra in una forma di frase nel momento in cui viene applicata la produzione $A \to α$ , data questa definizione tutti i contesti differiscono solo per il prefisso $β$ (utile per calcolare l’insieme)

CONTESTI SINISTRI DI UNA PRODUZIONE

Data la definizione di cui sopra e possibile calcolare i contesti di una data produzione come concatenazione dell’insieme dei $β$ e del valore $α$ , l’insieme dei $β$ e detto l’insieme dei contesti sinistri di $A \to α$

l e f t c t x (A) = {β ∣ Z \Rightarrow * β A w, co n w \in V T^{*}}

Quindi per trovare i contesti $L R (0)$ e sufficiente trovare i contesti sinistri delle varie produzioni e concatenarli con il valore delle produzioni stesse

CALCOLO DEI CONTESTI SINISTRI

Data la produzione $B \to γ A δ$ si può dire che uno dei contributi al contesto sinistro di $A$ e dato dai contesti sinistri di $B$ concatenati al simbolo $γ$ :

l e f t c t x (A) \supseteq l e f t c t x (B) ∙ {γ}

Il ragionamento si può iterare fino a risalire allo scopo della grammatica che per definizione ha $l e f t c t x (Z) = {ϵ}$ , inoltre dai due postulati si deriva che la grammatica dei contesti e sempre regolare a sinistra (riconoscibile da un RSF)

Data la grammatica che segue:

Z \to S

S \to a S A B ∣ B A

A \to a A ∣ B

B \to b

Applicando quanto detto prima si ottengono i seguenti contesti sinistri

l e f t c t x (Z) \to {ϵ}

l e f t c t x (S) \to L c t x Z ∣ L c t x S ∙ a

l e f t c t x (A) \to L c t x S ∙ a s ∣ L c t x S ∙ B ∣ L c t x A ∙ a

l e f t c t x (B) \to L c t x S ∙ a S A ∣ L c t x S ∣ L c t x A

Dati i contesti sinistri se i corrispondenti CONTESTI LR(0) non collidono l’automa riconoscitore sara deterministico

flowchart TD
A((1))
B((2))
C((3))
D((4))
E((5))
F((6))
G(Z->S)
H(B->b)
I(A->B)
J(S->BA)
K(A->aA)
L(S->aSAB)
START:::hidden --> A
A --a--> B
A --b--> H
A --B--> D
A --S--> G
B --b--> H
B --a--> B
B --S--> C
C --b--> H
C --A--> E
D --b--> H
D --a--> F
D --A--> J
D --B--> I
E --B--> L
E --b--> H
F --a--> F
F --b--> H
F --B--> I
F --A--> K
classDef hidden display: none

TABELLA DI PARSING $L R (0)$

La tabella di parsing puo essere ricostruita con le seguenti regole

per ogni arco $S_{1} \to S_{2}$ con input il simbolo terminale a, si inserisce in tabella alla posizione $(S 1, a)$ l’azione shift to $S 2$
per ogni arco $S_{1} \to S_{2}$ con input (da stack) il metasimbolo $X$ , si inserisce in tabella alla posizione $(S_{1}, X)$ l’azione goto $S_{2}$
per ogni stato $S_{i}$ associato alla regola $R$ -esima, $A \to α$ . si inserisce in tabella l’azione reduce $R$ in tutta la riga corrispondente allo stato Si
per ogni stato Si contenente la produzione $Z \rightarrow S.\$$ si inserisce in tabella alla posizione$ (S_i , $)$ l’azione accept

Quindi per l’automa precedente si ha la seguente tabella di parsing

	$a$	$b$	$$$	$S$	$A$	$B$
1	$s_{2}$	$s_{11}$		$g_{10}$		$g_{4}$
2	$s_{2}$	$s_{11}$		$g_{3}$		$g_{4}$
3	$s_{6}$	$s_{11}$			$g_{5}$	$g_{12}$
4	$s_{6}$	$s_{11}$			$g_{13}$	$g_{12}$
5		$s_{11}$				$g_{15}$
6	$s_{6}$				$g_{14}$	$g_{12}$
10			$a$
11	$r_{1}$	$r_{1}$	$r_{1}$
12	$r_{2}$	$r_{2}$	$r_{2}$
13	$r_{3}$	$r_{3}$	$r_{3}$
14	$r_{4}$	$r_{4}$	$r_{4}$
15	$r_{5}$	$r_{5}$	$r_{5}$

RICONOSCITORI PER LINGUAGGI $L R (0)$

I riconoscitori per i linguaggi $L R (0)$ data la forma di frase corrente operano come segue:

eseguono SHIFT se lo stato dell’automa non e terminale e pongono nello stack il simbolo terminale letto da input
eseguono REDUCE se lo stato dell’automa e terminale e poppano dallo stack i simboli corrispondenti della parte destra della produzione applicata e pongono nello stack il metasimbolo della parte sinistra (non avvengono letture da input)

ogni volta che avviene una riduzione l’automa riparte dall’inizio

OTTIMIZZAZIONE, LO STACK DEGLI STATI

Per ottimizzare si può disporre di uno stack degli stati dove accumulare via via gli stati attraversati dall’automa e in fase di reduce rimuoverne tanti quanti i simboli della parte destra della produzione, in questo modo si evita di far ricominciare l’automa dall’inizio

CONDIZIONE SUFFICIENTE PER ANALISI $L R (0)$

Per poter effettuare con successo l’analisi $L R (0)$ date due produzioni $A \to α$ e $B \to ω$ se: $θ \in L R (0) c t x (A \to α)$ e $θw \in L R (0) c t x (B \to ω)$ allora deve essere vero che

w = ϵ, A = B, α = ω

Ovvero ogni stato di riduzione dell’automa non deve avere archi uscenti caratterizzati da non terminali e sia etichettato

LIMITI DELL’ANALISI $L R (0)$

l’analisi $L R (0)$ presenta dei limiti intrinsechi dovuti al fatto di ragionare solo sul contesto corrente e non avere nessuna informazione sui simboli in input successivi, per questo le grammatiche utili che rispettano la condizione sufficiente per analisi lr(0) non sono molte, per ottenere un riconoscitore utile e necessario vedere nel futuro

ANALISI $L R (k)$

L’analisi $L R (k)$ opera secondo le stesse logiche di analisi LR(0) estendendone le definizioni e ritardando le regole di riduzione di $k$ simboli, tuttavia la complessità data dal numero di stati dell’esecutore risulta di difficile gestione anche nel caso $k = 1$ e richiede semplificazioni (come $SR L$ o $L A L R$ ) le casistiche con $k > 1$ non sono neanche pensabili

ESTENSIONE DELLE DEFINIZIONI DI CONTESTO

Il contesto $L R (k)$ viene cosi definito

L R (k) c t x (A \to α) = {γ ∣ γ = β αu, Z \Rightarrow * β A u w \Rightarrow β αu w, co n w \in V T^{*}}

si aggiunge una stringa di lunghezza $k$ dopo il simbolo non terminale della produzione $u$

La stringa in questione appartiene all’insieme $FO LL O W_{k} (A)$ definito come segue:

FO LL O W_{K} (A) = {k \in V T^{k} ∣ S \Rightarrow * γ A k β}

il caso $k = 1$ e quanto introdotto parlando di riconoscitori LL

AUTOMA RICONOSCITORE

L’automa riconoscitore si sviluppa similmente a quanto visto per il caso $k = 0$ tuttavia il numero di stati dell’automa aumenta esponenzialmente con il numero di metasimboli e terminali dato che il numero di metasimboli della grammatica dei contesti sinistri e dato da:

(n - 1) \times t^{k} + 1

con $t$ simboli terminali e $n$ simboli non terminali della grammatica

APPROSSIMANDO $L R (0)$

L’analisi $L R (1)$ per quanto potente risulta troppo complessa nel caso pratico, l’idea di base e quella di semplificare accorpando gli stati dell’automa che risultano simili fra loro

SIMPLE LR (SLR)

Simple LR mira a semplificare l’automa riconoscitore, i contesti $S L R (0)$ sono cosi definiti

S L R (k) c t x (A \to α) = L R (0) c t x (A \to α) ∙ FO LL O W_{k} (A)

Si puo dunque calcolare facilmente a partire dal contesto $L R (0)$ inoltre e vero che:

S L R (k) c t x (A \to a lp ha) \supseteq L R (k) c t x (A \to α)

ovvero il contesto SLR è un po’ più grande, e quindi più esposto a potenziali conflitti, del contesto LR completo

Look-Ahead LR (LALR)

Un altra idea consiste nel accorpare assieme gli stati del parser $L R (1)$ identici al netto dei look-ahead set:

PRO: è una trasformazione sempre possibile, spesso molto conveniente perché il parser LALR ha molti meno stati dell’LR
CONTRO: possono apparire conflitti reduce/reduce, tipicamente gestibili.

PREVIOUS NEXT

Explorer

ANALISI $L R (K)$

ARCHITETTURA DI UN PARSER $L R$

ANALISI $L R (0)$

CONTESTI $L R (0)$

CONTESTI SINISTRI DI UNA PRODUZIONE

CALCOLO DEI CONTESTI SINISTRI

TABELLA DI PARSING $L R (0)$

RICONOSCITORI PER LINGUAGGI $L R (0)$

OTTIMIZZAZIONE, LO STACK DEGLI STATI

CONDIZIONE SUFFICIENTE PER ANALISI $L R (0)$

LIMITI DELL’ANALISI $L R (0)$

ANALISI $L R (k)$

ESTENSIONE DELLE DEFINIZIONI DI CONTESTO

AUTOMA RICONOSCITORE

APPROSSIMANDO $L R (0)$

SIMPLE LR (SLR)

Look-Ahead LR (LALR)

Graph View

Backlinks

Explorer

ANALISI LR(K)

ARCHITETTURA DI UN PARSER LR

ANALISI LR(0)

CONTESTI LR(0)

CONTESTI SINISTRI DI UNA PRODUZIONE

CALCOLO DEI CONTESTI SINISTRI

TABELLA DI PARSING LR(0)

RICONOSCITORI PER LINGUAGGI LR(0)

OTTIMIZZAZIONE, LO STACK DEGLI STATI

CONDIZIONE SUFFICIENTE PER ANALISI LR(0)

LIMITI DELL’ANALISI LR(0)

ANALISI LR(k)

ESTENSIONE DELLE DEFINIZIONI DI CONTESTO

AUTOMA RICONOSCITORE

APPROSSIMANDO LR(0)

SIMPLE LR (SLR)

Look-Ahead LR (LALR)

Graph View

Backlinks

ANALISI $L R (K)$

ARCHITETTURA DI UN PARSER $L R$

ANALISI $L R (0)$

CONTESTI $L R (0)$

TABELLA DI PARSING $L R (0)$

RICONOSCITORI PER LINGUAGGI $L R (0)$

CONDIZIONE SUFFICIENTE PER ANALISI $L R (0)$

LIMITI DELL’ANALISI $L R (0)$

ANALISI $L R (k)$

APPROSSIMANDO $L R (0)$