Menu English Ukrainian Russo INÍCIO

Biblioteca técnica gratuita para amadores e profissionais Biblioteca técnica gratuita


ENCICLOPÉDIA DE RÁDIO ELETRÔNICA E ENGENHARIA ELÉTRICA
Biblioteca gratuita / Esquemas de dispositivos radioeletrônicos e elétricos

Codificação de fala em sistemas de comunicação celular digital. Enciclopédia de rádio eletrônica e engenharia elétrica

Biblioteca técnica gratuita

Enciclopédia de eletrônica de rádio e engenharia elétrica / A telefonia móvel

Comentários do artigo Comentários do artigo

O artigo relembra os princípios gerais da codificação digital de fala em telecomunicações. O autor aborda com detalhes suficientes os processos de codificação muito complexos usados ​​em sistemas de comunicação celular digital. Pesquisas teóricas e soluções originais de engenharia possibilitaram a criação de um elegante radiotelefone de pequeno porte. Os complexos processos que ocorrem nele, que os usuários e até muitos especialistas em telecomunicações nem mesmo conhecem, o leitor aprenderá com este artigo.

Os mistérios dos sinais de fala atraíram a atenção dos pesquisadores muito antes do advento da comunicação elétrica. No século 1707, um dos maiores matemáticos, o acadêmico de São Petersburgo Leonard Euler (1783-16), escreveu em uma carta a uma princesa alemã datada de 1761 de junho de XNUMX: , a invenção mais importante ... A adição de tal máquina não me parece impossível.

A ideia de inventar uma máquina falante excitou a mente de muitos criadores, que não apenas buscaram criá-la na forma que Euler imaginou, mas também como meio de transmissão de fala à distância. Por exemplo, o inventor do telefone, A. G. Bell (1847-1922), estava envolvido no projeto de tal máquina. No entanto, no final, descobriu-se que a transmissão de fala à distância pode ser realizada sem essa máquina. Isso foi alcançado de forma bastante simples. Usando um microfone, as vibrações do ar que transportavam a fala eram convertidas em vibrações de corrente elétrica, que eram transmitidas por fios, e na extremidade receptora, usando um telefone, eram novamente convertidas em vibrações do ar.

Este método de transmissão é chamado analógico por causa da óbvia analogia entre as vibrações do ar que carregam o som e as vibrações elétricas que transmitem o som. Estudos de transmissão de fala analógica com modulação de amplitude mostraram que uma faixa de frequência de 300 a 3400 Hz é suficiente para uma qualidade de reprodução de fala normal. Essa banda foi adotada como padrão internacional e a rede telefônica mundial foi construída com base nela. O princípio de operação desta rede hoje é familiar não apenas para todos os sinalizadores, mas também para o público em geral.

Transmissão de fala digital em redes de comunicação com fio

Mudanças fundamentais nas abordagens para a organização das comunicações telefônicas surgiram quando os meios de comunicação foram transferidos para a tecnologia digital. As vantagens dos métodos de transmissão digital são amplamente conhecidas. Vamos relembrar apenas o mais importante deles - a tecnologia digital permite fornecer qualquer qualidade predeterminada de comunicação. Para transmissão de fala digital, é necessário realizar uma conversão analógico-digital do sinal de fala: submeter o sinal analógico a amostragem, quantização e codificação. A combinação dessas operações é chamada de modulação por código de pulso (PCM). Para descrever com precisão a forma de um sinal de fala, de acordo com o teorema de Kotelnikov, ele deve ser amostrado a uma frequência de 8 kHz (ou seja, coletar amostras a cada 125 μs) e, para obter qualidade de reprodução de fala normal, cada amostra deve ser quantizada em uma escala dividida em 8192 níveis (ao escolher uma escala de quantização uniforme). Leva 13 bits para codificar cada valor de amostra como um número binário.

Como resultado, para transmitir uma conversa telefônica usando uma seqüência de pulsos binários, é necessária uma velocidade de 8x13 = 104 kbps (que corresponde a uma faixa de frequência de 52 kHz com codificação ótima). Comparando esse número com a largura de banda de 3100 Hz necessária para a transmissão analógica, não podemos deixar de ficar impressionados com o enorme aumento na largura de banda necessária que ocorre às custas dos benefícios da transmissão digital. É natural tentar reduzir a taxa de transmissão ao implementar um sistema de transmissão digital.

O primeiro passo nessa direção é bastante óbvio. A quantização em 213 níveis é necessária porque os níveis dos sinais de fala analógicos podem variar na faixa de 60 dB. Neste caso, os sinais de alto nível com uma escala de quantização uniforme são quantizados com o mesmo passo que os sinais de baixo nível. Mas como a percepção dos sinais pelos órgãos auditivos humanos é proporcional ao logaritmo do nível do sinal, seria natural quantizar os sinais de alto nível de forma mais aproximada e os sinais de baixo nível com mais precisão. Ao aplicar a quantização não linear usando uma lei logarítmica, oito bits por amostra podem ser dispensados, mantendo quase a mesma qualidade de transmissão. Como resultado, a taxa de bits será de 64 kbps. É essa velocidade que se tornou a mais utilizada, é fixada na recomendação CCITT C.711 e o equipamento PCM opera nela em muitos países.

A velocidade pode ser reduzida ainda mais?

O sinal analógico tem muita redundância. Isso permite que você preveja a próxima amostra e transmita apenas a diferença entre o valor real e o valor previsto de cada amostra. Se você aplicar um bom esquema de previsão, a mudança na amplitude do incremento do sinal será menor que a mudança na amplitude do próprio sinal, o que levará a uma diminuição na quantidade de informação transmitida. Este princípio é usado para construir PCM diferencial (DPCM) e PCM diferencial adaptativo (ADPCM), o que torna possível reduzir a taxa de fala para 32 kbit/s e inferior devido à complicação adicional do equipamento transceptor. Continuando a complicar o equipamento, é possível aumentar a taxa de fala para 100-300 bps. Pode-se imaginar, por exemplo, um conversor de fala para texto no lado transmissor e uma máquina de leitura no lado receptor.

Existem maneiras conhecidas de reduzir ainda mais a velocidade de transmissão da fala, mas não vamos nos deter nisso. O fato é que o equipamento para transmissão de voz digital na velocidade de 64 kbit / s agradou a todos porque se mostrou eficiente ao usar os cabos simétricos mais simples com um par de torções. O equipamento IKM-30 iniciou sua procissão triunfal com a compactação de linhas de conexão entre as centrais telefônicas da cidade. Onde antes era possível organizar uma linha de conexão em um par de cabos para transmitir apenas uma conversa, o equipamento IKM-30 possibilitou organizar a transmissão de 30 conversas no mesmo par. O melhor uso desse par com a ajuda de equipamentos analógicos para comunicação multicanal estava fora de questão.

Mais tarde, surgiram os equipamentos IKM-120 e outros sistemas de alto desempenho operando em cabos coaxiais e fibras ópticas, e a agudeza da questão de reduzir a taxa de transmissão de sinais falados abaixo de 64 kbps em redes de comunicação com fio foi praticamente removida. Mesmo os inúmeros desenvolvimentos de equipamentos de transmissão digital com velocidade de 32 kbps, implementados em muitos países com base no princípio ADPCM (incluindo o desenvolvimento realizado em nosso país sob a liderança de M. U. Polyak), não foram amplamente utilizados. O equilíbrio entre o aumento da largura de banda do equipamento formador de canal e a complexidade do equipamento terminal nas comunicações com fio ainda não pende a favor da primeira solução.

Codificação de voz em sistemas de rádio celular digital

Perspectivas bastante diferentes se abriram no final dos anos 1980 e início dos anos 1990, quando os sistemas de radiotelefonia digital celular começaram a se desenvolver. Ao contrário das redes com fio, onde a expansão da largura de banda é possível com a implantação de novas linhas, ou seja, renovando os recursos de largura de banda, as redes de rádio têm uma lei rígida de estanqueidade e você precisa lidar com um recurso de radiofrequência não renovável. É verdade que a ideia das comunicações celulares é justamente renovar o recurso de radiofrequência repetindo a frequência de transmissão no território ao qual não chega o sinal da mesma frequência da estação de rádio interferente. Mas as possibilidades de tal renovação do recurso também são limitadas aqui, então a complicação adicional do equipamento para reduzir a taxa de transmissão acaba sendo justificada.

Por exemplo, no sistema de comunicação celular digital GSM adotado na maioria dos países europeus, as taxas de voz padrão são 13 e 6,5 kbps. Para implementar tal sistema de transmissão, foi necessário recorrer à velha ideia da máquina de Euler e uma penetração mais profunda no mecanismo de produção da fala.

Como se sabe, um dos resultados mais importantes da teoria moderna da transmissão de informações é a recomendação de separar as tarefas de codificação de fonte e codificação de canal. A tarefa de codificar a fonte de informação inclui descrever a mensagem transmitida da forma mais econômica, ou seja, removendo a redundância na mensagem. A mensagem comprimida assim recebida torna-se mais vulnerável a interferências e pode ser corrompida durante a transmissão. Portanto, após a codificação da fonte, é aplicada a codificação do canal, cuja tarefa é proteger a mensagem transmitida contra interferências. A codificação de canais exige que seja introduzida alguma redundância na mensagem transmitida, mas não aleatória, que estava presente na mensagem original, mas estritamente justificada teoricamente e que garante a qualidade de transmissão especificada.

Até agora, consideramos apenas problemas de codificação de fonte, que abordaremos agora a partir de posições mais gerais.

Portanto, existe uma versão digital de um sinal de fala analógico, ou seja, uma função que descreve, por exemplo, a lei da mudança de corrente com o tempo. É necessário tentar remover a redundância de tal sinal. Este problema pode ser resolvido de várias maneiras. Uma delas é tentar encontrar redundância por meio de uma análise puramente matemática da função em questão. Outra forma de resolver o problema é analisar as características acústicas dessa função (do ponto de vista de sua percepção pelos órgãos da audição). Finalmente, pode-se procurar redundância modelando o próprio processo de produção da fala. É o último desses métodos que encontrou aplicação nos modernos sistemas de comunicação de rádio digital.

O mecanismo para a formação dos sons da fala é que o som rico em harmônicos das cordas vocais, que muda sua força e frequência fundamental, é processado posteriormente na cavidade oral. Este último funciona, primeiramente, como um ressonador que, ao ser reconstruído, destaca certas frequências - formantes que determinam as diferenças entre os sons vocálicos. Em segundo lugar, os movimentos de língua, dentes e lábios modulam o som, produzindo diferentes consoantes. Na década de 1930, a Bell Telephone Laboratories (EUA) construiu uma máquina baseada na ideia de Euler, cujos princípios se baseavam em tentativas de simular o funcionamento dos órgãos da fala humana.

Para sintetizar a fala na extremidade receptora de um sistema de comunicação, você precisa de um gerador de frequência de áudio de espectro rico, um gerador de ruído branco, um conjunto de filtros formantes (seu número é pequeno, pois existem poucas vogais e cada um deles é bastante bem definido por dois formantes) e circuitos moduladores. Com tal conjunto de equipamentos na extremidade receptora, é possível transmitir pelo canal de comunicação não um sinal de fala, mas apenas comandos que controlam o processo de síntese de fala. Assim, a tarefa prática é encontrar uma forma de gerar os comandos necessários. É esse problema que os designers de telefones celulares resolvem.

No sistema GSM dos primeiros lançamentos, o fluxo digital original de um sinal de fala com taxa de transmissão de 104 kbps é dividido em blocos separados de 160 amostras, que são gravadas. Cada um desses blocos leva um intervalo de tempo de 20 ms (ou seja, são armazenadas sequências de 160x13=2080 bits). As sequências registradas são analisadas, como resultado para cada uma delas são encontrados oito coeficientes de filtragem que determinam as ressonâncias correspondentes e um sinal de excitação. É essa informação que é transmitida ao receptor, que reproduz o sinal de fala original dele, semelhante ao que acontece nos órgãos da fala humana (esse órgão, por assim dizer, é ajustado por meio de oito parâmetros, e então o som é obtido quando está excitado).

No entanto, a análise mencionada cobre períodos de tempo comparativamente curtos e não consegue detectar sons de vogais longas que envolvem blocos vizinhos. Portanto, a previsão de longo prazo é usada para eliminar a redundância ao pronunciar vogais longas. Para isso, o transmissor armazena as sequências transmitidas com duração de 15 ms, com as quais são comparadas as sequências atuais. Das já transmitidas, é selecionada a sequência que tem maior correlação com a atual (ou seja, mais parecida com a atual), sendo transmitida apenas a diferença entre a sequência atual e a selecionada. Como as sequências gravadas no transmissor são conhecidas do receptor, basta transmitir uma indicação de qual das sequências gravadas foi feita a comparação. Assim, consegue-se uma redução adicional na quantidade de informação transmitida. Como resultado do processamento descrito, obtém-se um bloco de sinal de fala digital de 20 ms, contendo 260 bits e tendo uma taxa de transmissão de apenas 13 kbps (ou seja, oito vezes menor que a original). O procedimento descrito é chamado de excitação de pulso regular com previsão de longo prazo (abreviação inglesa PRE-LTR, que significa Excitação de Pulso Regular - Previsão de Longo Prazo).

Na próxima etapa, entra em ação a codificação do canal, cuja tarefa é proteger contra interferências no canal de comunicação. A técnica de codificação moderna é baseada em ideias profundas de álgebra e teoria da probabilidade. Com base nessas ideias, foram desenvolvidos vários métodos de codificação muito eficazes que resolvem certos problemas em cada caso específico. Limitamo-nos aqui a uma breve revisão de algumas das ideias utilizadas no sistema GSM.

A proteção de código pode servir apenas para detectar o fato de um erro ou para corrigir erros ocorridos. A primeira opção é muito mais fácil de implementar, mas menos útil, porque neste caso é necessário solicitar a retransmissão do bloco de mensagem no qual foi detectado um erro ou levar em consideração a presença de um erro de alguma outra forma. Uma vez que os bits individuais no sinal de voz digital obtido no decurso dos procedimentos de codificação da fonte descritos acima não são de igual importância, eles são divididos em três subclasses e sujeitos a diferentes métodos de proteção durante a codificação do canal. Dos 260 bits do bloco recebido, os mais importantes são os bits que carregam informações sobre os parâmetros de filtragem, a amplitude do sinal do bloco e os parâmetros de previsão de longo prazo. Esses bits pertencem à chamada subclasse Ia (50 bits). Em seguida, vem a subclasse Ib (132 bits contendo ponteiros e informações sobre pulsos de excitação regulares, bem como alguns parâmetros de previsão de longo prazo). Os 78 bits restantes são classe II.

Codificação de voz em sistemas celulares digitais

Para proteger o bloco descrito, dois métodos de codificação são usados. Primeiro, um código de bloco é usado para detectar erros que permanecem não corrigidos. Este código pertence à classe dos cíclicos, em que cada combinação de códigos é obtida por uma permutação cíclica de elementos. Quando codificado com este código, mais três bits de verificação são adicionados aos bits da subclasse Ia, pelos quais o decodificador pode determinar se esta subclasse contém erros não corrigidos. Se o decodificador detectar erros de transmissão nos bits da subclasse Ia, todo o quadro de conversação de 260 bits será descartado. Nesse caso, o quadro perdido é reproduzido por interpolação com base nas informações do quadro anterior. Verificou-se que com esta solução a qualidade de transmissão é melhor do que no caso de reprodução de bits errados da subclasse Ia. Em segundo lugar, um código convolucional é aplicado para corrigir erros. Este nome do código é explicado pela operação matemática de convolução aplicada às funções que descrevem o processamento da sequência de bits codificada. Ao contrário de um código de bloco, um código convolucional é contínuo no sentido de que, quando aplicado, os processos de codificação e decodificação são executados não em blocos fixos, mas em uma sequência contínua de símbolos.

O código convolucional é aplicado tanto aos bits da subclasse Ia, juntamente com os bits de verificação, quanto aos bits da subclasse Ib. Essas duas sequências são combinadas e aumentadas em quatro bits (veja abaixo na Fig. 2), que assumem valores zero. Os últimos servem para retornar o codificador ao seu estado original após a codificação. O código aplicado é caracterizado pelos parâmetros r=1/2 e K=5. O coeficiente r = 1/2 indica que para cada bit que entra na entrada do codificador, são obtidos exatamente dois bits na sequência codificada e K = 5 denota o comprimento da conexão, que é coberto pela operação de convolução. Essas características podem ser compreendidas a partir do esquema de codificação convolucional mostrado na Fig. 1, que também mostra o esquema de adição do módulo 2 (operação lógica "OU exclusivo"). Assim, como resultado da codificação, 189 bits são obtidos dos 378 bits recebidos e bits desprotegidos da classe II são adicionados a eles, resultando em um comprimento total do bloco igual a 456 bits (Fig. 2). Isso é exatamente oito sub-blocos de 57 bits. A partir desses sub-blocos, são formadas rajadas de transmissão de rádio com divisão de tempo.

Codificação de voz em sistemas celulares digitais

Este artigo é dedicado às questões de codificação de sinais de fala e, como pode ser entendido pelo que foi descrito, a parcela do processador colocada em um aparelho de pequeno porte responde por uma quantidade bastante grande de seu processamento digital. No entanto, as tarefas do processador estão longe de serem esgotadas. Como você sabe, em vez da transmissão de voz, um sistema de comunicação celular permite organizar um canal de transmissão de dados, que é codificado de acordo com regras completamente diferentes. Mas, além dos canais lógicos para transmitir informações úteis (pagas), um grande número de canais lógicos para transmitir sinais de controle é organizado em um telefone celular. Cada um desses canais lógicos está sujeito a requisitos específicos para codificação de informações e, consequentemente, cada um desses canais contribui com sua parcela para a carga do processador.

Uma ideia geral dos esquemas de codificação, bem como a formação de flashes para a transmissão de todos os canais lógicos no sistema de comunicação radiotelefônica, é dada na Fig. 3.

Codificação de voz em sistemas celulares digitais

Aqui, dez canais lógicos diferentes são mostrados no nível superior, indicando os tamanhos dos blocos de mensagens nesses canais (na forma de números ou letras específicas - P0, N0, etc. - onde esses números podem mudar). O próximo nível mostra o primeiro estágio de codificação para diferentes canais lógicos, indicando o número de bits da sequência original e a sequência obtida após a codificação. Se um código de detecção de erro cíclico for usado para o canal de fala, então vários códigos cíclicos de correção de erro são usados ​​para os canais restantes, incluindo o código cíclico Fire que corrige uma série de erros. No segundo estágio de codificação, o código convolucional já mencionado é aplicado. Além disso (estágio 3), para distribuir os 456 bits recebidos entre rajadas individuais (cada uma carregando dois blocos de 57 bits), são aplicadas as operações de mistura de bits e permutação de blocos (transposição direta ou diagonal).

O volume total de processamento de sinal em um telefone celular é estimado em milhões de operações por segundo. Assim, ao contrário de um telefone convencional, um telefone celular é um computador em miniatura, mas muito produtivo. Por um lado, analisa "seu próprio" sinal de fala, desenvolvendo comandos de controle para síntese de fala no aparelho do interlocutor e, por outro lado, este computador implementa a ideia de Euler, sintetizando a fala do interlocutor de acordo com comandos de controle vindos do canal de comunicação .

Autor: V. Neumann, prof., doutor em tecnologia. Ciências, Moscou

Veja outros artigos seção A telefonia móvel.

Leia e escreva útil comentários sobre este artigo.

<< Voltar

Últimas notícias de ciência e tecnologia, nova eletrônica:

Couro artificial para emulação de toque 15.04.2024

Em um mundo tecnológico moderno, onde a distância está se tornando cada vez mais comum, é importante manter a conexão e uma sensação de proximidade. Os recentes desenvolvimentos em pele artificial por cientistas alemães da Universidade de Saarland representam uma nova era nas interações virtuais. Pesquisadores alemães da Universidade de Saarland desenvolveram filmes ultrafinos que podem transmitir a sensação do toque à distância. Esta tecnologia de ponta oferece novas oportunidades de comunicação virtual, especialmente para aqueles que estão longe de seus entes queridos. As películas ultrafinas desenvolvidas pelos investigadores, com apenas 50 micrómetros de espessura, podem ser integradas em têxteis e usadas como uma segunda pele. Esses filmes atuam como sensores que reconhecem sinais táteis da mãe ou do pai e como atuadores que transmitem esses movimentos ao bebê. O toque dos pais no tecido ativa sensores que reagem à pressão e deformam o filme ultrafino. Esse ... >>

Areia para gatos Petgugu Global 15.04.2024

Cuidar de animais de estimação muitas vezes pode ser um desafio, especialmente quando se trata de manter a casa limpa. Foi apresentada uma nova solução interessante da startup Petgugu Global, que vai facilitar a vida dos donos de gatos e ajudá-los a manter a sua casa perfeitamente limpa e arrumada. A startup Petgugu Global revelou um banheiro exclusivo para gatos que pode liberar fezes automaticamente, mantendo sua casa limpa e fresca. Este dispositivo inovador está equipado com vários sensores inteligentes que monitoram a atividade higiênica do seu animal de estimação e são ativados para limpeza automática após o uso. O dispositivo se conecta à rede de esgoto e garante a remoção eficiente dos resíduos sem a necessidade de intervenção do proprietário. Além disso, o vaso sanitário tem uma grande capacidade de armazenamento lavável, tornando-o ideal para famílias com vários gatos. A tigela de areia para gatos Petgugu foi projetada para uso com areias solúveis em água e oferece uma variedade de recursos adicionais ... >>

A atratividade de homens atenciosos 14.04.2024

O estereótipo de que as mulheres preferem “bad boys” já é difundido há muito tempo. No entanto, pesquisas recentes conduzidas por cientistas britânicos da Universidade Monash oferecem uma nova perspectiva sobre esta questão. Eles observaram como as mulheres respondiam à responsabilidade emocional e à disposição dos homens em ajudar os outros. As descobertas do estudo podem mudar a nossa compreensão sobre o que torna os homens atraentes para as mulheres. Um estudo conduzido por cientistas da Universidade Monash leva a novas descobertas sobre a atratividade dos homens para as mulheres. Na experiência, foram mostradas às mulheres fotografias de homens com breves histórias sobre o seu comportamento em diversas situações, incluindo a sua reação ao encontro com um sem-abrigo. Alguns dos homens ignoraram o sem-abrigo, enquanto outros o ajudaram, como comprar-lhe comida. Um estudo descobriu que os homens que demonstraram empatia e gentileza eram mais atraentes para as mulheres do que os homens que demonstraram empatia e gentileza. ... >>

Notícias aleatórias do Arquivo

Tratamento de água barato 20.06.2018

Bob Tilton e Todd Pshibizen, dois professores de engenharia biomédica e engenharia química da Carnegie Mellon University, criaram uma maneira interessante de filtrar a água. É baseado nas sementes da árvore oleaginosa indiana.

Especialistas propuseram o uso das sementes de oleaginosas de moringa. A árvore cresce bem em regiões tropicais e subtropicais e é cultivada para produtos alimentícios e óleos. Suas sementes já foram usadas para purificar alguns tipos de água, mas observou-se que essa água só pode permanecer pura por 24 horas.

Os cientistas decidiram combinar o método de filtragem de areia e o método de extração de proteínas das sementes de moringa. Assim, isolando proteínas e adsorvendo-as na superfície de partículas de dióxido de silício, o principal componente da areia, eles criaram "f-sand" ("f-sand"). Vale ressaltar que este método de stonecrop não é apenas barato, mas também universal, pois é adequado para água de qualquer dureza. Além disso, a água que passou por essa purificação é enriquecida com microelementos úteis e "carregada".

Outras notícias interessantes:

▪ Processadores Imagination Catapult RISC-V

▪ Computador chaveiro Azulle Access3 com processador Intel

▪ Winchester Hitachi Deskstar 7K2000

▪ Estação de acoplamento portátil Iogear GUD3C02

▪ Carregadeira Agrícola Autônoma Loadix

Feed de notícias de ciência e tecnologia, nova eletrônica

 

Materiais interessantes da Biblioteca Técnica Gratuita:

▪ seção do site Builder, home master. Seleção de artigos

▪ artigo Construção de um modelo semi-cópia. dicas para modelista

▪ artigo Como as bibliotecas se originaram? Resposta detalhada

▪ artigo Requisitos básicos para o pessoal de primeiros socorros

▪ artigo Registrador eletrônico de eventos. Enciclopédia de rádio eletrônica e engenharia elétrica

▪ artigo Carregador para baterias de chumbo-ácido seladas. Enciclopédia de rádio eletrônica e engenharia elétrica

Deixe seu comentário neste artigo:

Имя:


E-mail opcional):


Comentário:





Todos os idiomas desta página

Página principal | Biblioteca | Artigos | Mapa do Site | Revisões do site

www.diagrama.com.ua

www.diagrama.com.ua
2000-2024