Week7 Teoría de Comunicaciones 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 26

󾠴

SEMANA 7
Codificación por Predicción Lineal (LPC)
Hasta ahora hemos codificado la señal sin tomar en cuenta su origen. Ahora, tomando
como ejemplo la voz, podremos requerir menos tasa de bits y por ende menor ancho
de banda.
La señal de voz tiende a tener esta forma con picos relativamente periódicos y es
formada por la glotis (abre y cierra el flujo de aire) y las cuerdas vocales (vibración)
Además, los sonidos emitidos se componen de voiced (vocales) y unvoiced (s o f)
sounds.

Fuente
Teniendo esto en cuenta podemos modelar la glotis como una fuente que
suministra un tren de pulsos o como una fuente de ruido blanco (cuando toda la
glotis se abre y sale solo aire sin vibración).
Esta fuente sirve como señal de entrada para la cavidad bucal

Cavidad Bucal
También se llama cavidad resonante y funciona como un filtro del ruido blanco
para emitir ciertos sonidos. Presenta una frecuencia de resonancia que depende de la
posición de la lengua con respecto al paladar. En esta cavidad que tomaremos 17cm

SEMANA 7 1
como su medida, se pueden producir diferentes armónicos de los que se puede hallar
su frecuencia de resonancia:

Sin embargo, ya que la cavidad bucal varía por persona, los armónicos pueden estar
en el rango de:

Formantes
A esta variación en la frecuencia de resonancia se le conoce como los formantes, esto
son lo que definen, al final, el sonido que produce la voz.

Las personas tenemos 4 formantes principales, osean tenemos 4 primeros armónicos


cuyas frecuencias irán cambiando dependiendo del sonido que uno produzca:

SEMANA 7 2
Entonces al analizar la voz vemos la fuente que lo produce y los formantes que hacen
que ese sonido se produzca. Al ver la imagen podemos ver cierta periodicidad que se
produce por el tren de pulsos y también vemos las frecuencias que son ocasionadas
por los formantes. Estos formantes al pasar el tiempo pueden ir cambiando según el
tipo de sonido que se esté produciendo

SEMANA 7 3
La visualización de estos gráficos es importante porque nos permite modelar la parte
final de la producción del sonido (cavidad resonante y cavidad nasal)

Los formantes los puedo tomar como si fueran 4 filtros pasabandas con diferentes
amplitudes y frecuencias, dicho esto me quedarían 4 filtros en serie

Formantes como filtros:


Tomo los filtros con sus parámetros Z y tendría 2 polos por cada filtro, así en el filtro
total Hz tendría como 8 polos

Filtro por radiación del sonido


Existe un filtro final de todo este sistema que corresponde a la apertura de los labios.
Este filtro mocha las componentes frecuenciales conforme la frecuencia aumenta. Es
un filtro lineal por lo que las frecuencias van a tener una caída lineal.

Normalmente este filtro es de orden 1 o 2 por lo que la función Hz tendrá como mínimo
9 polos (1 o 2 más con el ultimo filtro)

SEMANA 7 4
Esta última equivalencia con la sumatoria es muy similar, sino igual, al que se usó en la
parte predictiva en la codificación diferencial. Es como si se tuviera la función
transferencia de ese filtro solo que en la parte del denominador y restado con uno

Además, si tomo a esa expresión de la sumatoria como Mz podría armar un modelo


con la entrada y salida como en un sistema realimentado:

Al final la función de transferencia me queda muy parecida al predictor, es por eso que
este tipo de codificación se llama “por Predicción Lineal”

Fuentes
Cuando el sonido es sonoro lo que se requiere es un tren de pulsos como fuente
para que module la parte de la glotis

Cuando el sonido es insonoro, se usa ruido blanco que es básicamente abrir toda
la glotis

SEMANA 7 5
Ahora lo que necesito es un switch que se active dependiendo del sonido que quiera
realizar y luego un amplificador que depende de cada persona (si lo dice alto o bajito)

Finalmente tenemos la componente de cavidad resonante realimentada que me


obtendrá mi fsintonizada(t). Con este proceso se puede lograr reducir la tasa de
bits necesaria para su transmisión

Bits necesarios:
Ahora analizamos que para el switch necesito 1 bit.

Para indicar la frecuencia del tren de pulsos se necesitarían 6 bits.

Para la ganancia podría necesitar 5 bits

Para enviar el valor de cada de los coeficientes (Ci ) de Mz necesito 4 bits. Como
son entre 9 y 10 coeficientes digamos unos 40 bits

En total tengo aprox unos 52 bits necesarios

SEMANA 7 6
Ahora, considerando el modelo de la voz, esta tiende a ser cuasiperiódica con unos
periodos que van variando entre los 10 a 25 ms

Transmisión LPC
En PCM se mandaban las muestras codificadas, en el diferencial se mandaban los
errores de predicción codificados.
En este caso se envían parámetros del sintetizador (modelo de la cavidad resonante,
tipo de fuente)

1. Se muestrea la fuente con Sampler and Holder

2. Se toman las muestras cada (10-25) ms, ya que en ese tiempo la señal de voz era
cuasi-estacionaria

3. Linear Prediction Analysis: Se encarga de extraer los parámetros Ci y Cp . Para


su extracción se aplica el concepto de minimizar el error cuadrático medio. Esto es
parecido al DCPCM donde se minimiza el error de predicción, pero en este caso es
un error de síntesis

Análisis de Correlación: Analiza la frecuencia y amplitud del tren de



pulsos. Si la correlación es 0, quiere decir que la señal corresponde a un
sonido no vocalizado. Esto es para activar un switch para discriminar si
tengo un sound o unsound voice

4. Todos esos parámetros descritos en (3) se van al sintetizador de voz. Por lo que yo
puedo generar una voz artificial sintetizada sobre un tiempo de 10-25 ms, la cual se
compara con la señal original y se obtiene un Error de Sintesis

SEMANA 7 7
5. Finalmente, lo que se transmite en el canal de comunicación es el error de síntesis
junto con todos los parámetros correspondientes al sintetizador de voz

6. Al final se tiene un codificador que asigna una distinta cantidad de bits a los
parámetros y al error, y esto se transmite al canal de comunicación

Ahora analizaremos los bits necesarios para todo este proceso. Ojo que hace rato
dijimos que para el Ci se necesitaban 4 bits pero en realidad se necesitan 6:

SEMANA 7 8
Los bits necesarios, en comparación con el PCM o Código de Línea, son bajísimos

Lo único malo es que la voz se escucha bastante artificial

Receptor LPC:
Nos llega los parámetros más el error de síntesis.

Tenemos un decodificador para extraer los parámetros del modelo de la cavidad


bucal y la fuente además del error de síntesis

Al sintetizador ingresan los parámetros para obtener mi señal de voz sintetizada a


la cual se le suma el error a la señal de salida

Al final se obtiene una señal que se aproxima a la verdadera. Ojo que esta
reconstrucción no se hace por muestras sino por intervalos de análisis que son
relativamente largos con respecto a los intervalos de muestreo

Recordar que la principal desventaja de este sistema es que la voz suena muy artificial

En resumen: Técnicas para la codificación de voz


Codificación de forma de onda: Que solo considera la señal muestreada sin
considerar su naturaleza

PCM

ADPCM

Codificación paramétrica LPC: Se hace a traves de un reproductor artificial de


voz que suena bastante robotizado

Codificación híbrida: Combina lo mejor de las 2 anteriores siendo una de las


técnicas más representativa la técnica CELP

SEMANA 7 9
CELP: Code Excited Linear Prediction, es una técnica híbrida decente con la
desventaja que toma mucho tiempo de análisis para calcular el índice o fuente
correcta y, además, tiene buen retardo.

Ya no utiliza como fuente ni un tren de pulsos ni ruido blanco. Utiliza detectores o


intervalos de muestra de la señal original para tratar de encontrar el vector o el rango
de muestras óptimas para un intervalo de señal.
Consigue una baja tasa de bits sin enviar el valor de la fuente o del vector de señal sino
lo que envía es un índice o puntero a una lista de vectores o muestras de fuentes que
se deben usar.
Han surgido 2 variantes nuevas del CELP que son: Low Delay CELP (LD - CELP) y A –
CELP

Comparación de Técnicas
Compararemos las distintas técnicas de codificación y sus distintas aplicaciones.

Se nota que según el puntaje MOS (lo bien que se escucha) el que gana es el PCM.
Sin embargo para elegir un ganador, depende de lo que valoremos más (bit rate,
millones de instrucciones x segundo o Framing Size)

SEMANA 7 10
Aplicación de TDM+PCM
Para la transmisión se tienen 3 partes, el teléfono, el bucle ovulado (desde el poste
hasta la central) y la central telefónica.
Ni el teléfono directo ni el bucle ovulado han cambiado mucho con el pasar de los años.
Las conexiones físicas siguen siendo las mismas. Lo que si ha evolucionado es la
central telefónica, inicialmente la comunicación era mecánica, para luego ser
electromecánica, electrónica y digital.
Pero no solo tenemos un teléfono, sino varios conectados a la central telefónica. En la
central se conecta los teléfonos que se quieren intercomunicar.

La señal sale de manera analógica, llega a la central y sale también de forma analógica
por lo que la aplicación del PCM se hace dentro de la central
Se muestrea a 8000 muestas/s en el ADC para una frecuencia de voz de entre 300 y
3400 Hz. Y como se usan v=8 bits, al final se envía a 64 kbps por el PCM Ley mu o Ley
A. Dicha forma de transmisión es la recomendad por la UIT G.711

Ahora, cada central está ubicada, por ejemplo, en cierto distrito. Para la
intercomunicación de alguien en San Miguel y alguien en Pueblo Libre la información
tiene que pasar por ambas centrales y para que eso sea posible se unen ambas
centrales con las Líneas Troncales. Estos cables eran primero pares de cobre
trenzados, luego coaxiales, circuitos de microondas, fibra óptica

SEMANA 7 11
Ahora, si varios usuarios de San Miguel se quieren conectar con varios de Pueblo Libre
al mismo tiempo, se necesita utilizar un TDM. Por lo tanto, en las Líneas Troncales está
el PCM para codificar y el TDM para enviar.
Como existen inmensidad de centrales telefónicas, distritales, regionales, nacionales e
internacionales se agrupa de forma piramidal o por jerarquías. Cosa que, si alguien de
SM quiere hablarle a alguien de otro departamento, sube de jerarquía a nivel regional y
luego baja otra vez.

TDM+PCM (si, otra vez ¬.¬)


Después de codificarlo en PCM, cada señal codificada se lo guarda en un buffer de 8
bits. Este buffer almacena de forma temporal los 8 bits de cada muestra y luego se van
tomando cada muestra y se entrega una data multiplexada.

SEMANA 7 12
Entonces, en el tiempo tengo 1 grupo de 8 bits correspondiente a la señal S1 , otro para
la señal S2 y así hasta Sn . Esa es mi primera trama, luego sigue otra trama y así. Cada
trama tiene N*8 bits y un tiempo de cuadro que es 1/fo (1/8000), por lo que la tasa
TDM-PCM es (N ∗ 8)/125μs bps.

Marcador
Acordarse que en el TDM-PAM estaba el concepto de marcador que indicaba el
comienzo y termino de una trama enviando un pulso muy grande o negativo
distinguible. Sin embargo, esta SINCRONIZACIÓN se vuelve más compleja y
elaborada en PCM ya que solo se pueden mandar ‘1’ y ‘0’ y no se puede variar la
amplitud del pulso como si se podía en PAM.

Señalización
Son todas aquellas señales que permiten establecer, mantener y liberar una llamada
telefónica. Por ejemplo, cuando levantas el fono, escuchas un tono de servicio y al
marcar y timbrar escuchas otro sonido, esos no son señales de voz sino de
señalización

Ambas señales tienen que ir también en el TDM, por lo tanto, se transmite:

TDM+PCM

SEMANA 7 13
Sincronismo digital que es distinto al sincronismo de PAM donde se usa un
marcador

Señalización para las señales distintas a las de la voz, como la de timbrado, el tono
ocupado o el número marcado

Para implementar estas señales existen estándares americanos y europeos

Estándar europeo:
También llamado 30+2 o E1

En un primer nivel se considera multiplexar 30 llamadas telefónicas (N=30). Sin


embargo, la forma como introduce la información de sincronismo y señalización
hace que la trama cambie. Entonces ya no tenemos 30 canales de 8 bits, sino
tenemos 30 + 2. Esos 2 grupo adicionales de 8 bits son para sincronismo y
señalización.

En el canal 0, se manda la sincronización y en el canal 16, los bits para la


sincronización. Por lo que ahora cada trama constaría de 32 canales de 8 bits y con
una duración de 125μs. Para lograr ese tiempo mi tasa sería de (32)(8)/(125μs)= 2.048
Mbps

Ahora falta ver el tema de la sincronización para saber la diferenciación entre canales.
Como solo se pueden enviar ‘1’ y ‘0’ puedo enviar un patrón de sincronismo (01100110)
y este sería mi marcador para indicar el fin de trama. Como se tiene un canal 0 para la
sincronización por acá se envía ese código y se identifica en mi secuencia de bitas ese
patrón, una vez se encuentre, sé que los 8 bits siguientes serán del canal 1 y así hasta
el siguen periodo de trama cuando me encuentre con el canal 0 otra vez.

SEMANA 7 14
Para la señalización se utilizan 8 bits y para canal tendría una tasa de r= (8bits)/(125μs)
(30)

Estándar americano:
También llamado T1(Tier 1)

Se multiplexan 24 llamadas telefónicas y no hay ningún canal para sincronismo ni


señalización.

Para el sincronismo se utiliza un solo bit al final de cada trama. Por lo tanto, la
trama o cuadro está compuesto por N=24 canales de 8 bits c/u + 1bit de
sincronización

El tiempo de trama sigue siendo de 125 μs. Por lo tanto la tasa de bits sería de r=
(24*8 +1)/125μs, lo que nos da una tasa conocida de 1.544 Mbps

Señalización:
Se aplica el concepto de bit robbed, donde cada 6ta trama se roba un bit a cada
canal

Entonces en la trama 6, se roba el bit menos significativo de los 24 canales y se lo


asigna a la señalización.

Al hallar la tasa de bits se tiene r= 24bits_robados/cada 6 tramas*125 = 32 kbps, y


para cada canal sería 32/24 kbps

SEMANA 7 15
Por si acaso el T1 y el E1 están estandarizados en la UIT G.703

Cuando diferentes centrales de telefonía quieren interconectarse lo hacen mediante el


sistema E1 y todas llegan a una central de nivel superior, por lo que dentro de esta
deberá existir una multiplexación con todas las señales en E1
Al multiplexar todas las señales E1 provenientes de diferentes distritos, notamos que
los clocks de cada una de las señales no están de ninguna manera sincronizados por lo
que en promedio tendré una tasa de bits con una cierta variación que va desde los 20 a
50 ppm.
Por lo tanto, finalmente tengo una cantidad de bits en 1 segundo con variaciones de
entre 20 y 50 bits demás o faltantes

SEMANA 7 16
Justificación o Relleno de Bits
Ahora, tengo que enviar todas esas señales mediante una nueva portadora. En una
analogía:

Si se tienen 12 cajitas de ancho 2 cm ± 0.1 cm y quiero encajarlas todas en 1 sola caja


grande, puedo sobredimensionar dicha caja grande asumiendo que todas las cajas
pequeñas medirán 2.1 cm. Sin embargo, al hacer esto, como en algunos casos
medirán 2 cm o 1.9 cm, la caja tendrá espacio sobrante. Pero esto se soluciona si
pongo un bloque de cierto espesor entre caja y caja de modo que al ponerlas todas me
queden exactamente ajustadas.

Ahora si quiero recuperar dichas cajitas, solo saco las cajas una por una, botando ese
bloque que me ayudo a rellenar la caja mayor
En la realidad tengo tráfico que está dentro de un rango, lo multiplexo sobre una
portadora de mucha más capacidad de bps de tal forma que inserto bits relleno para
que calcen justamente la cantidad de bits que corresponde en la portadora de mayor
capacidad. Y cuando llega el destino descarto los bit relleno y solo me quedo con el
tráfico original

Por ejemplo, si tengo 4 canales de 100 ± 1 bps cada uno, tendría que multiplicarlo con
una portadora de 404 bps. Con esto se asegura que así todos los canales se
sobrecarguen, aún se pueda mandar la información. Pero si por ejm, los 4 llegan a
tener 99 bps, tengo que insertar 2 bits relleno por cada canal para llegar al máximo de
101 bits por canal.

SEMANA 7 17
Multiplexaje cuasi síncrono o plesiócrono

El MUX plesiócrono es aquel que multiplexa señales digitales que provienen de fuentes
que tienen su propio reloj de sincronismo. Por lo q la entrada tiene una cierta tasa de
bits sumado con una cierta variación y los adecua todos a una cierta tasa r_o que de
alguna forma esta sincronizada con el reloj maestro RM que como ya dijimos es mayor
aN ∗ r’ , (donde r’ es la velocidad r ± Δr ).
Este primer bloque de rojo que pasa cada reloj a uno ro , se conoce como bloque
regulador de velocidad de bits

Bloque Regulador de Bits


Está compuesto por un buffer, que almacena los bits que llegan y los envía a otra
velocidad normalizada r_o

Al momento que ingresa el r’, cada bit tiene su posición y para eso necesito saber
su sincronismo. Este se puede extraer de la misma señal o enviar por un canal
aparte

SEMANA 7 18
Almacenamiento Elástico
Viéndolo en el dominio del tiempo:

1. Tenemos la entrada de bits (‘1’ y ‘0’)

2. Clock de escritura r: Señal de sincronismo de la señal de entrada r’ que es un pulso


muy pequeño al inicio de cada bit

3. En r_o tengo una serie de pulsos, pero ya con frecuencia diferente

4. Para el flip-flop, el r y el r’ son su Set y Reset respectivamente, por ello toma la


forma que se observa y se asemeja a una modulación PWM

5. El comando relleno permanece en cero hasta que el bit r_o alcance al r, una vez lo
alcanza, se activa por unos instantes para “invalidar” esa comparación errada y
ahora en siguiente periodo tomo el r que no comparé y el siguiente r_o

6. En la salida se escriben cada uno de los bits que se van comparando hasta que
llega el relleno y también se escribe, luego se sigue donde se quedó

SEMANA 7 19
Unidad de control
Cada señal de entrada con su respectivo reloj entra al almacenamiento elástico y
tiene 2 salidas, una de bits hacia el mux y otra de flip-flops entrando a la unidad de
control. Con esos flipflops, el control sabe si deberá leer un bit de información o
insertar un bit relleno.

Esta información entra a un multiplexor pequeño que ya está sincronizado con el


reloj maestro R_M del MUX

Al final se multiplexan todos los bits de todos los canales de forma ordenada (b11,
b12…, b1n)(b21, b22, … b2n) y por ahí uno que otro bit de relleno

SEMANA 7 20
Variable 'D' y 'X'
Ahora se intenta hacer una trama con la salida del MUX plesiócrono:

Una trama estaría compuesta por los bits de datos ‘D’, en los que ya se incluye el
relleno, más unos bits de control ‘X’. Todo esto comprendería una trama de un MUX
Plesiócrono con periodo T_f
En los bits ‘X’ se encuentra el sincronismo (sync), también unos bits para la detección y
corrección de bits errados (C). Ojo que ya no se incluye bits para la señalización, ya
que esos ya vienen incluidos en cada uno de los canales de entrada del MUX

SEMANA 7 21
Variable 'S'
Los bits de relleno se producen cada vez que el clock interno del multiplexor ha
superado el clock con el cual llegan los flujos de bits al MUX.

La tasa de bits de este multiplexor plesiocrono es los bits D+X entre el tiempo de
trama Tf

Los bits ‘D’ están conformados por Bits de información más Bits de relleno. Puedo
hallar la cantidad PROMEDIO de bits rellenos en una trama Tf :

Los bits de información, en promedio son Tf ∗ r’ ∗ N


Los bits de relleno en promedio se hallan con la variable ‘s’ que representa los
bits de relleno por canal y por cuadro.

Osea, si s=1 y tengo 4 canales, en promedio tengo 1 bit relleno por cada canal, osea
que en promedio en un cuadro tengo 4 bits relleno (1 por canal)
Si s=1/2, puede ser que en un cuadro ‘A’ hay un bit relleno y en el mismo cuadro ‘A’
pero de la siguiente trama, ya no hay bit relleno. Por lo tanto, con esas 2 tramas, en
promedio hay 1/2 bit relleno

Osea que con s=1/2 y teniendo 4 canales, tendré 1 bit relleno por canal cada 2
cuadros.  En total me da 1/2  bit relleno por cuadro
En general hay N*s  bits rellenos por cuadro

SEMANA 7 22
Ahora, si reemplazo la ecuación D = N ∗ r’ ∗ Tf + N ∗ s en la expresión Ro =
D + X/Tf

Esta expresión nos quiere decir que la velocidad de salida es N veces la velocidad
nominal de cada flujo de bits que ingresa al MUX-P multiplicado por ese factor con ‘D’ y
‘X’ y como ese factor es siempre mayor a 1, entonces se deduce que la velocidad R_o
siempre será mayor a N veces r’

Ahora, sabemos que existe una velocidad mínima y máxima para r’ pero hay una
tolerancia máxima para el MUX. Por ejemplo, si tengo 2.048 Mbps, que tanto más o
menos se puede desviar y que mi MUX siga funcionando correctamente.

SEMANA 7 23
En la ecuación 2 tenemos que el valor de los bits ya está establecido en D= Nr’T_f + Ns
(OJO que s tiende a ser menor a 1).
Cómo podemos calcular la velocidad máxima y mínima del MUX-P?. Tenemos que
preguntarnos, cuándo se hace necesario insertar bits rellenos, cuando la velocidad de
entrada es máxima o mínima. La respuesta es cuando esta es mínima, por lo tanto,
mientras la velocidad sea más baja, el s (que está entre 0 y 1) irá aumentando.
Por lo tanto, con s=1 tengo que mi velocidad en su mínimo. Por otro lado, cuando
el flujo es bastante rápido y no se necesitan insertar bit relleno, entonces mi s=0
y D= Nr’_max*T_f + N. Defino las velocidades mínima y máxima

Con esto quiero decir que la velocidad con la que las portadoras llegan al MUX-P no
pueden ser ni muy altas ni muy bajas porque el MUX no lo va a tolerar.
Entonces esta velocidad tendrá un máximo desplazamiento entre su máximo y su
mínimo. Cabe notar que con s=1/2 no da un desplazamiento simétrico a cada lado. Ese
máximo y mínimo se define en base a la arquitectura del MUX, en base a la capacidad
de almacenaje en el buffer, en base al ‘s’.
Obviamente lo ideal es que la velocidad caiga dentro del rango y no tan cercano a los
extremos, ya que si alcanza la velocidad del buffer este no podrá regularlo

SEMANA 7 24
Problema: ¿Qué sucede si la señal que me llega, tiene una velocidad que se sale del
rango de ya definí? A esto se le denomina como deslizamiento o SLIP, acá se
empiezan a asignar bits que no corresponden o bits errados

Importante (aclaraciones)
Una cosa es la variación máxima y mínima vista desde la fuente:

Puede ser 50ppm o 30ppm

Y otra cosa es la variación máxima y mínima en el multiplexor plesiosíncrono

La cual por webos tiene que ser mayor que la de la fuente

El 's' puede ser tomado como un valor fijo o también como un valor variable.

SEMANA 7 25
Por ejemplo, para cierto MP, a la salida puedo tener un s=3 que quiere decir que, en
promedio, tengo 3 bits de relleno cada 10 cuadros. Sin embargo, al ser este un
promedio no representa lo que pasa en tiempo real, ya que se pueden presentar una
fila de 3 bits relleno en un cuadro y no presentar ninguno en los otros 9 cuadros. Como
tambien tener 1 bit en 3 cuadros c/u y en el resto nada y seguir'e teniendo mis 3 bits
relleno cada 10 cuadros en promedio

SEMANA 7 26

También podría gustarte