Enviando e Recebendo Sons pela Internet

Renato M.E. Sabbatini, PhD


Para enviar e receber sons e voz pela Internet, é preciso entender primeiro o que é "som digital" e como ele pode ser produzido e reproduzido como um fenômeno sonoro.

O que é o som?

É uma ondulação (vibração) da pressão do ar, que quando chega aos nossos órgãos auditivos, produz a percepção. Um som puro consiste de uma vibração na qual a amplitude varia em função do tempo de acordo com uma forma sinusoidal. O número de vezes que a onda se repete no tempo é chamado de freqüência, que é medida em ciclos por segundo (Herz, ou Hz). Quanto maior a freqüência de um som, mais agudo ele nos parece.

O ouvido humano é sensível a vibrações sonoras compreendidas entre as freqüências de 100 Hz a 20.000 Hz. A voz é constituida por uma mistura complexa de freqüências (sons formantes) e pausas (silêncios), como vemos abaixo:


Formato de onda da palavra "Alô"

Como funcionam os sistemas eletrônicos de amplificação e reprodução de som?

Os sistemas de som funcionam com base na transformação de ondas sonoras em ondas elétricas, e vice-versa. Esse fenômeno é chamado de transdução, e os equipamentos que o realizam são chamados de transdutores. Para transduzir uma onda de pressão sonora em sua equivalente (analógica) elétrica, é usado o microfone. Para realizar a transdução inversa é usado o altofalante (ou o fone de ouvido). Geralmente, nos sistemas chamados de alta-fidelidade, a forma e freqüência das ondas elétricas são praticamente idênticas às das ondas sonoras, e vice-versa.

O que é som digital?

O som digital nada mais é do que uma seqüência de valores numéricos (medidas) tomadas da amplitude da onda sonora em intervalos regulares de tempo. Esse processo é denominado de digitalização. O computador, por trabalhar com valores digitais (1, 2, 3, etc.). é incapaz de gravar fenômenos continuamente variáveis (analógicos) em sua memória (como acontece em uma fita cassete, por exemplo), por isso eles precisam ser convertidos para valores digitais, antes. No gráfico abaixo, vemos como uma onda continuamente variável é convertida em uma seqüência de valores numéricos, através da técnica de histograma:


Os valores digitais seqüenciais que são obtidos pelo processo de digitalização são armazenados na memória do computador, e constituem um arquivo sonoro digital. O sistema numérico usado pelo computador digital é o sistema binário, portanto os valores de amplitude são gravados como uma seqüência de zero (0) e uns (1).

Processo de Criação do Arquivo Sonoro Digital

  1. O som é captado por um microfone  ligado ao estetoscópio, que gera ondas elétricas proporcionais às ondas sonoras
  2. As ondas elétricas são digitalizadas usando-se o conversor analógico-digital disponível na placa de som do microcomputador (entrada auxiliar). Elas são convertidas em seqüências de números digitais binários ( por exemplo, 01001000111010101011111), que são armazenados na memória do computador
  3. As seqüências de números binários são comprimidas usando um software especial, e gerando um arquivo binário com a extensão WAV (wave, padrão do Windows).
Processo de Audição do Arquivo Sonoro Digital
  1. Um programa auxiliar (player), descomprime as seqüências de 0 e 1, e as envia para um conversor digital-analógico que está na saída da placa de som do microcomputador
  2. Os números binários digitais são convertidos para ondas elétricas analógicas, que reproduzem fielmente as ondas gravadas na etapa anterior
  3. As ondas elétricas são enviadas para o altofalante, que as converte em ondas sonoras proporcionais

Como um arquivo sonoro é transmitido pela Internet

Uma vez conseguido um arquivo sonoro digital, ele pode ser transmitido por uma rede de computadores como a Internet, como qualquer outro arquivo digital. Saindo do computador onde ele está armazenado, ele é dividido em segmentos menores de dados, chamados de "pacotes", que recebem o endereço de destino e são enviados pela Internet de forma seqüencial. Ao chegarem ao destino (outro computador), o arquivo é remontado na ordem correta, a partir dos pacotes que chegaram, e é armazenado em sua memória.

Como Funciona o "chat" de Voz

Um "chat" de voz, também chamado de "teleconferência audiográfica", permite que duas ou mais pessoas conversem entre si através da voz em modos ponto-a-ponto ou multipontos, dependendo do software utilizado. Cada participante deve ter um microcomputador com microfone, altofalantes e placa de som, que funcione segundo o princípio explicado acima, e uma conexão TCP/IP à Internet. Todos devem também executar uma cópia local do software cliente, que permite a conexão entre os vários participantes, através de um servidor mutuamente combinado, que é denominado de "refletor".

O chat de voz é baseado em um par cliente-servidor. O software-cliente (por exemplo, o Yahoo! Messenger) está instalado nos microcomputadores dos participantes do chat. Quando um participante fala, ele pressiona a tecla "Talk" e dá início ao processo de conversão analógico digital da sua voz, conforme mostramos acima. O fluxo de pacotes binários é enviado pelo TCP/IP através da Internet até o refletor ao qual está conectado. No refletor, um software especializado identifica todos os usuários que estão inscritos naquele canal do "chat" e seus respectivos endereços e duplica tantos pacotes de entrada quantos forem os destinatários da mensagem de voz. Tudo isso é feito em tempo real, usando uma técnica denominada "streaming" (fluxo contínuo).

Em seguida o refletor envia as cópias dos pacotes simultaneamente para cada um dos participantes conectados à Internet. Os pacotes são recebidos pelo mesmo software (por exemplo, Yahoo! Messenger) e enviados por este à placa de som e altofalantes de cada participante. Deste modo, a voz do participante que falou é ouvida pelos demais participantes, após um breve retardo.

Para Saber Mais

Sobre o autor

O Dr.. Renato M.E. Sabbatini é doutorado em fisiologia pela Faculdade de Medicina de Ribeirão Preto da USP, diretor associado do Núcleo de Informática Biomédica da UNICAMP e professor adjunto e coordenador da área de Informática Médica da Faculdade de Ciências Médicas da UNICAMP. É também presidente do Instituto Edumed para Educação em Medicina e Saúde.


Copyright (c) 2001 Renato M.E. Sabbatini
Todos os direitos reservados. Proibida a cópia por quaisquer meios,
sem a autorização por escrito do autor.
Instituto Edumed
Publicado em 14/6/2001