Esta página foi traduzida pela API Cloud Translation.

Começar a usar o WebRTC

Sam Dutton

O WebRTC é uma nova frente na longa guerra por uma Web aberta e sem restrições.
Brendan Eich, inventor do JavaScript

Comunicação em tempo real sem plug-ins

Imagine um mundo em que seu smartphone, TV e computador possam se comunicar em uma plataforma comum. Imagine se fosse fácil adicionar chat de vídeo e compartilhamento de dados ponto a ponto ao seu app da Web. Essa é a visão do WebRTC.

Quer fazer um teste? O WebRTC está disponível para computadores e dispositivos móveis no Google Chrome, Safari, Firefox e Opera. Um bom lugar para começar é o app de chat por vídeo simples em appr.tc:

Abra appr.tc no navegador.
Clique em Participar para entrar em uma sala de chat e permitir que o app use sua webcam.
Abra o URL exibido no final da página em uma nova guia ou, melhor ainda, em outro computador.

Início rápido

Não tem tempo para ler este artigo ou quer apenas o código?

Para ter uma visão geral do WebRTC, assista ao seguinte vídeo do Google I/O ou confira estes slides:
Se você não usou a API getUserMedia, consulte Capturar áudio e vídeo em HTML5 e simpl.info getUserMedia.
Para saber mais sobre a API RTCPeerConnection, consulte o exemplo a seguir e 'simpl.info RTCPeerConnection'.
Para saber como o WebRTC usa servidores para sinalização e travessia de firewall e NAT, consulte os registros de código e do console de appr.tc.
Não quer esperar e quer testar o WebRTC agora? Teste algumas das mais de 20 demonstrações que exercitam as APIs JavaScript do WebRTC.
Está com problemas na sua máquina e no WebRTC? Acesse o Solucionador de problemas de WebRTC.

Ou acesse diretamente o codelab do WebRTC, um guia detalhado que explica como criar um app completo de videochamadas, incluindo um servidor de sinalização simples.

Uma breve história do WebRTC

Um dos últimos grandes desafios da Web é permitir a comunicação humana por voz e vídeo, ou seja, a comunicação em tempo real (RTC, na sigla em inglês). A RTC precisa ser tão natural em um app da Web quanto digitar texto em uma entrada de texto. Sem ela, sua capacidade de inovar e desenvolver novas formas de interação é limitada.

Historicamente, o RTC tem sido corporativo e complexo, exigindo tecnologias caras de áudio e vídeo para serem licenciadas ou desenvolvidas internamente. Integrar a tecnologia RTC com conteúdo, dados e serviços atuais tem sido difícil e demorado, principalmente na Web.

O chat de vídeo do Gmail se tornou popular em 2008 e, em 2011, o Google lançou o Hangouts, que usa o Talk (assim como o Gmail). O Google comprou a GIPS, uma empresa que desenvolveu muitos componentes necessários para RTC, como codecs e técnicas de cancelamento de eco. O Google tornou de código aberto as tecnologias desenvolvidas pelo GIPS e se envolveu com os órgãos de padrões relevantes na Internet Engineering Task Force (IETF) e no World Wide Web Consortium (W3C) para garantir o consenso do setor. Em maio de 2011, a Ericsson criou a primeira implementação do WebRTC.

O WebRTC implementou padrões abertos para comunicação de vídeo, áudio e dados em tempo real sem plug-ins. A necessidade era real:

Muitos serviços da Web usavam RTC, mas precisavam de downloads, apps nativos ou plug-ins. Entre eles, estavam o Skype, o Facebook e o Hangouts.
Fazer o download, instalar e atualizar plug-ins é complexo, propenso a erros e irritante.
É difícil implantar, depurar, resolver problemas, testar e manter plug-ins, que podem exigir licenciamento e integração com tecnologias complexas e caras. Muitas vezes, é difícil persuadir as pessoas a instalar plug-ins.

Os princípios orientadores do projeto WebRTC são que as APIs dele devem ser de código aberto, sem custo financeiro, padronizadas, integradas a navegadores da Web e mais eficientes do que as tecnologias atuais.

Onde estamos agora?

O WebRTC é usado em vários apps, como o Google Meet. O WebRTC também foi integrado ao WebKitGTK+ e aos apps nativos do Qt.

O WebRTC implementa estas três APIs: - MediaStream (também conhecido como getUserMedia) - RTCPeerConnection - RTCDataChannel

As APIs são definidas nestas duas especificações:

As três APIs são compatíveis com dispositivos móveis e computadores pelo Chrome, Safari, Firefox, Edge e Opera.

getUserMedia: para demonstrações e código, consulte exemplos do WebRTC ou confira os exemplos incríveis de Chris Wilson que usam getUserMedia como entrada para áudio da Web.

RTCPeerConnection: para uma demonstração simples e um app de chat por vídeo totalmente funcional, consulte Exemplos de conexão de pares do WebRTC e appr.tc, respectivamente. Esse app usa o adapter.js, um shim JavaScript mantido pelo Google com a ajuda da comunidade WebRTC, para abstrair as diferenças entre navegadores e as mudanças de especificação.

RTCDataChannel: para ver isso em ação, confira as amostras do WebRTC e veja uma das demonstrações do canal de dados.

O codelab do WebRTC mostra como usar as três APIs para criar um app simples de chat por vídeo e compartilhamento de arquivos.

Seu primeiro WebRTC

Os apps WebRTC precisam fazer várias coisas:

Receber streaming de áudio, vídeo ou outros dados.
Receber informações de rede, como endereços IP e portas, e trocá-las com outros clientes WebRTC (conhecidos como peers) para permitir a conexão, mesmo por NATs e firewalls.
Coordenar a comunicação de sinalização para informar erros e iniciar ou encerrar sessões.
Trocar informações sobre mídia e recursos do cliente, como resolução e codecs.
Comunicar streaming de áudio, vídeo ou dados.

Para adquirir e comunicar dados de streaming, o WebRTC implementa as seguintes APIs:

O MediaStream tem acesso a fluxos de dados, como os da câmera e do microfone do usuário.
O RTCPeerConnection permite fazer ligações de áudio ou vídeo com recursos de criptografia e gerenciamento de largura de banda.
O RTCDataChannel permite a comunicação ponto a ponto de dados genéricos.

Mais adiante, vamos discutir em detalhes os aspectos de rede e sinalização do WebRTC.

API `MediaStream` (também conhecida como API `getUserMedia`)

A API MediaStream representa streams de mídia sincronizados. Por exemplo, um stream capturado com entrada de câmera e microfone tem faixas de vídeo e áudio sincronizadas. Não confunda MediaStreamTrack com o elemento <track>, que é algo totalmente diferente.

Talvez a maneira mais fácil de entender a API MediaStream seja analisá-la em uso:

No navegador, acesse Exemplos do WebRTC getUserMedia.
Abra o console.
Inspecione a variável stream, que está no escopo global.

Cada MediaStream tem uma entrada, que pode ser um MediaStream gerado por getUserMedia(), e uma saída, que pode ser transmitida para um elemento de vídeo ou um RTCPeerConnection.

O método getUserMedia() usa um parâmetro de objeto MediaStreamConstraints e retorna uma Promise que é resolvida em um objeto MediaStream.

Cada MediaStream tem um label, como 'Xk7EuLhsuHKbnjLWkW4yYGNJJ8ONsgwHBvLQ'. Uma matriz de MediaStreamTracks é retornada pelos métodos getAudioTracks() e getVideoTracks().

No exemplo getUserMedia, stream.getAudioTracks() retorna uma matriz vazia (porque não há áudio) e, supondo que uma webcam funcional esteja conectada, stream.getVideoTracks() retorna uma matriz de um MediaStreamTrack que representa o stream da webcam. Cada MediaStreamTrack tem um tipo ('video' ou 'audio'), um label (algo como 'FaceTime HD Camera (Built-in)') e representa um ou mais canais de áudio ou vídeo. Nesse caso, há apenas uma faixa de vídeo e nenhum áudio, mas é fácil imaginar casos de uso em que há mais, como um app de chat que recebe streams da câmera frontal, da câmera traseira, do microfone e de um app compartilhando a tela.

Um MediaStream pode ser anexado a um elemento de vídeo definindo o atributo srcObject. Antes, isso era feito definindo o atributo src como um URL de objeto criado com URL.createObjectURL(), mas isso foi descontinuado.

Observação : o MediaStreamTrack está usando ativamente a câmera, o que consome recursos e mantém a câmera aberta e a luz acesa. Quando não estiver mais usando uma faixa, chame track.stop() para que a câmera possa ser fechada.

O getUserMedia também pode ser usado como um nó de entrada para a API Web Audio:

// Cope with browser differences.
let audioContext;
if (typeof AudioContext === 'function') {
  audioContext = new AudioContext();
} else if (typeof webkitAudioContext === 'function') {
  audioContext = new webkitAudioContext(); // eslint-disable-line new-cap
} else {
  console.log('Sorry! Web Audio not supported.');
}

// Create a filter node.
var filterNode = audioContext.createBiquadFilter();
// See https://dvcs.w3.org/hg/audio/raw-file/tip/webaudio/specification.html#BiquadFilterNode-section
filterNode.type = 'highpass';
// Cutoff frequency. For highpass, audio is attenuated below this frequency.
filterNode.frequency.value = 10000;

// Create a gain node to change audio volume.
var gainNode = audioContext.createGain();
// Default is 1 (no change). Less than 1 means audio is attenuated
// and vice versa.
gainNode.gain.value = 0.5;

navigator.mediaDevices.getUserMedia({audio: true}, (stream) => {
  // Create an AudioNode from the stream.
  const mediaStreamSource =
    audioContext.createMediaStreamSource(stream);
  mediaStreamSource.connect(filterNode);
  filterNode.connect(gainNode);
  // Connect the gain node to the destination. For example, play the sound.
  gainNode.connect(audioContext.destination);
});

Apps e extensões baseados no Chromium também podem incorporar o getUserMedia. Adicionar permissões audioCapture e/ou videoCapture ao manifesto permite que a permissão seja solicitada e concedida apenas uma vez após a instalação. Depois disso, o usuário não precisa permitir o acesso à câmera ou ao microfone.

A permissão só precisa ser concedida uma vez para getUserMedia(). Na primeira vez, um botão "Permitir" é exibido na barra de informações do navegador. O acesso HTTP para getUserMedia() foi descontinuado pelo Chrome no final de 2015 por ser classificado como um recurso avançado.

A intenção é ativar um MediaStream para qualquer fonte de dados de streaming, não apenas uma câmera ou um microfone. Isso permite o streaming de dados armazenados ou fontes de dados arbitrárias, como sensores ou outras entradas.

O getUserMedia() ganha vida quando combinado com outras APIs e bibliotecas JavaScript:

O Webcam Toy é um app de cabine de fotos que usa o WebGL para adicionar efeitos estranhos e incríveis a fotos que podem ser compartilhadas ou salvas localmente.
FaceKat é um jogo de rastreamento facial criado com headtrackr.js.
A ASCII Camera usa a API Canvas para gerar imagens ASCII.

Imagem ASCII gerada por idevelop.ro/ascii-camera — gUM ASCII art!

Restrições

As restrições podem ser usadas para definir valores de resolução de vídeo para getUserMedia(). Isso também permite suporte a outras restrições, como proporção, modo de câmera (frontal ou traseira), taxa de frames, altura e largura, além de um método applyConstraints().

Por exemplo, consulte Exemplos de WebRTC getUserMedia: selecionar resolução.

Atenção : as restrições getUserMedia podem afetar as configurações disponíveis de um recurso compartilhado. Por exemplo, se uma câmera foi aberta no modo 640 x 480 por uma guia, outra guia não poderá usar restrições para abri-la em um modo de resolução mais alta, porque ela só pode ser aberta em um modo. Essa é uma informação sobre a implementação. Seria possível deixar a segunda guia reabrir a câmera em um modo de resolução mais alta e usar o processamento de vídeo para reduzir a faixa de vídeo para 640 x 480 na primeira guia, mas isso não foi implementado.

Definir um valor de restrição não permitido gera um DOMException ou um OverconstrainedError se, por exemplo, uma resolução solicitada não estiver disponível. Para ver isso em ação, consulte Exemplos de WebRTC getUserMedia: selecione a resolução para uma demonstração.

Captura de tela e guia

Os apps do Chrome também permitem compartilhar um vídeo ao vivo de uma única guia do navegador ou de toda a área de trabalho usando as APIs chrome.tabCapture e chrome.desktopCapture. Para uma demonstração e mais informações, consulte Compartilhamento de tela com WebRTC. O artigo tem alguns anos, mas ainda é interessante.)

Também é possível usar a captura de tela como uma fonte MediaStream no Chrome usando a restrição experimental chromeMediaSource. A captura de tela requer HTTPS e só deve ser usada para desenvolvimento, já que é ativada por uma flag de linha de comando, conforme explicado nesta postagem.

Sinalização: controle de sessão, rede e informações de mídia

O WebRTC usa RTCPeerConnection para comunicar dados de streaming entre navegadores (também conhecidos como peers), mas também precisa de um mecanismo para coordenar a comunicação e enviar mensagens de controle, um processo conhecido como sinalização. Os métodos e protocolos de sinalização não são especificados pelo WebRTC. A sinalização não faz parte da API RTCPeerConnection.

Em vez disso, os desenvolvedores de apps WebRTC podem escolher o protocolo de mensagens que preferirem, como SIP ou XMPP, e qualquer canal de comunicação duplex (bidirecional) adequado. O exemplo appr.tc usa XHR e a API Channel como mecanismo de sinalização. O codelab usa o Socket.io em execução em um servidor Node.

A sinalização é usada para trocar três tipos de informações:

Mensagens de controle de sessão: para iniciar ou encerrar a comunicação e informar erros.
Configuração de rede: para o mundo exterior, qual é o endereço IP e a porta do seu computador?
Recursos de mídia: quais codecs e resoluções podem ser processados pelo seu navegador e pelo navegador com que ele quer se comunicar?

A troca de informações por sinalização precisa ser concluída com sucesso antes que o streaming ponto a ponto possa começar.

Por exemplo, imagine que Alice queira se comunicar com Bob. Confira um exemplo de código da especificação WebRTC do W3C (link em inglês), que mostra o processo de sinalização em ação. O código pressupõe a existência de algum mecanismo de sinalização criado no método createSignalingChannel(). No Chrome e no Opera, RTCPeerConnection está com um prefixo.

// handles JSON.stringify/parse
const signaling = new SignalingChannel();
const constraints = {audio: true, video: true};
const configuration = {iceServers: [{urls: 'stun:stun.example.org'}]};
const pc = new RTCPeerConnection(configuration);

// Send any ice candidates to the other peer.
pc.onicecandidate = ({candidate}) => signaling.send({candidate});

// Let the "negotiationneeded" event trigger offer generation.
pc.onnegotiationneeded = async () => {
  try {
    await pc.setLocalDescription(await pc.createOffer());
    // Send the offer to the other peer.
    signaling.send({desc: pc.localDescription});
  } catch (err) {
    console.error(err);
  }
};

// Once remote track media arrives, show it in remote video element.
pc.ontrack = (event) => {
  // Don't set srcObject again if it is already set.
  if (remoteView.srcObject) return;
  remoteView.srcObject = event.streams[0];
};

// Call start() to initiate.
async function start() {
  try {
    // Get local stream, show it in self-view, and add it to be sent.
    const stream =
      await navigator.mediaDevices.getUserMedia(constraints);
    stream.getTracks().forEach((track) =>
      pc.addTrack(track, stream));
    selfView.srcObject = stream;
  } catch (err) {
    console.error(err);
  }
}

signaling.onmessage = async ({desc, candidate}) => {
  try {
    if (desc) {
      // If you get an offer, you need to reply with an answer.
      if (desc.type === 'offer') {
        await pc.setRemoteDescription(desc);
        const stream =
          await navigator.mediaDevices.getUserMedia(constraints);
        stream.getTracks().forEach((track) =>
          pc.addTrack(track, stream));
        await pc.setLocalDescription(await pc.createAnswer());
        signaling.send({desc: pc.localDescription});
      } else if (desc.type === 'answer') {
        await pc.setRemoteDescription(desc);
      } else {
        console.log('Unsupported SDP type.');
      }
    } else if (candidate) {
      await pc.addIceCandidate(candidate);
    }
  } catch (err) {
    console.error(err);
  }
};

Primeiro, Alice e Bob trocam informações de rede. A expressão encontrar candidatos se refere ao processo de encontrar interfaces de rede e portas usando a estrutura ICE.

Alice cria um objeto RTCPeerConnection com um manipulador onicecandidate, que é executado quando os candidatos de rede ficam disponíveis.
Alice envia dados de candidatos serializados para Bob usando qualquer canal de sinalização que eles estejam usando, como WebSocket ou algum outro mecanismo.
Quando Bob recebe uma mensagem candidata de Alice, ele chama addIceCandidate para adicionar o candidato à descrição do peer remoto.

Os clientes WebRTC (também conhecidos como peers ou Alice e Bob neste exemplo) também precisam determinar e trocar informações de mídia de áudio e vídeo local e remota, como resolução e recursos de codec. A sinalização para troca de informações de configuração de mídia é feita com a troca de uma oferta e uma resposta usando o protocolo de descrição de sessão (SDP):

A Alice executa o método RTCPeerConnection createOffer(). O retorno disso é transmitido como um RTCSessionDescription, a descrição da sessão local de Alice.
No callback, Alice define a descrição local usando setLocalDescription() e envia essa descrição de sessão para Bob pelo canal de sinalização. RTCPeerConnection só começa a coletar candidatos quando setLocalDescription() é chamado. Isso está codificado no rascunho do JSEP IETF.
Bob define a descrição que Alice enviou como a descrição remota usando setRemoteDescription().
Bob executa o método RTCPeerConnection createAnswer(), transmitindo a descrição remota que recebeu de Alice para que uma sessão local compatível com a dela possa ser gerada. O callback createAnswer() recebe um RTCSessionDescription. Bob define isso como a descrição local e envia para Alice.
Quando Alice recebe a descrição da sessão de Bob, ela a define como a descrição remota com setRemoteDescription.
Ping!

Observação : permita que o RTCPeerConnection seja coletado como lixo chamando close() quando ele não for mais necessário. Caso contrário, as linhas de execução e as conexões são mantidas ativas. É possível vazar recursos pesados no WebRTC.

Os objetos RTCSessionDescription são blobs que obedecem ao Protocolo de descrição de sessões (SDP, na sigla em inglês). Serializado, um objeto SDP tem esta aparência:

v=0
o=- 3883943731 1 IN IP4 127.0.0.1
s=
t=0 0
a=group:BUNDLE audio video
m=audio 1 RTP/SAVPF 103 104 0 8 106 105 13 126

// ...

a=ssrc:2223794119 label:H4fjnMzxy3dPIgQ7HxuCTLb4wLLLeRHnFxh810

A aquisição e a troca de informações de rede e mídia podem ser feitas simultaneamente, mas ambos os processos precisam ser concluídos antes que o streaming de áudio e vídeo entre usuários possa começar.

A arquitetura de oferta/resposta descrita anteriormente é chamada de JavaScript Session Establishment Protocol, ou JSEP. Há uma animação excelente que explica o processo de sinalização e streaming no vídeo de demonstração da Ericsson para a primeira implementação do WebRTC.

Diagrama da arquitetura JSEP — Arquitetura JSEP

Depois que o processo de sinalização for concluído, os dados poderão ser transmitidos diretamente ponto a ponto entre o autor e o destinatário da chamada ou, se isso falhar, por um servidor de retransmissão intermediário (mais sobre isso depois). O streaming é o trabalho de RTCPeerConnection.

RTCPeerConnection

RTCPeerConnection é o componente WebRTC que processa a comunicação estável e eficiente de dados de streaming entre usuários.

Confira abaixo um diagrama da arquitetura do WebRTC mostrando a função do RTCPeerConnection. Como você vai perceber, as partes verdes são complexas.

Do ponto de vista do JavaScript, o principal a entender neste diagrama é que o RTCPeerConnection protege os desenvolvedores da Web das inúmeras complexidades que estão por baixo. Os codecs e protocolos usados pelo WebRTC fazem um trabalho enorme para tornar possível a comunicação em tempo real, mesmo em redes não confiáveis:

Ocultação de perda de pacotes
Cancelamento de eco
Adaptabilidade da largura de banda
Buffer de instabilidade dinâmico
Controle automático de ganho
Redução e supressão de ruído
Limpeza de imagens

O código W3C anterior mostra um exemplo simplificado do WebRTC do ponto de vista da sinalização. Confira a seguir dois exemplos de apps WebRTC em funcionamento. O primeiro é um exemplo simples para demonstrar RTCPeerConnection, e o segundo é um cliente de chat de vídeo totalmente operacional.

RTCPeerConnection sem servidores

O código a seguir foi extraído de Exemplos de conexão de peering do WebRTC, que tem e RTCPeerConnection locais e remotos (e vídeo local e remoto) em uma página da Web. Isso não constitui nada muito útil (o chamador e o destinatário estão na mesma página), mas torna o funcionamento da API RTCPeerConnection um pouco mais claro, porque os objetos RTCPeerConnection na página podem trocar dados e mensagens diretamente sem precisar usar mecanismos de sinalização intermediários.

Neste exemplo, pc1 representa o peer local (chamador) e pc2 representa o peer remoto (destinatário da chamada).

Autor da chamada

Crie um novo RTCPeerConnection e adicione o fluxo de getUserMedia(): ```js // Servers is an optional configuration file. (Consulte a discussão sobre TURN e STUN mais adiante.) pc1 = new RTCPeerConnection(servers); // ... localStream.getTracks().forEach((track) => { pc1.addTrack(track, localStream); });

Crie uma oferta e defina-a como a descrição local de pc1 e como a descrição remota de pc2. Isso pode ser feito diretamente no código sem usar sinalização, porque o autor e o destinatário da chamada estão na mesma página: js pc1.setLocalDescription(desc).then(() => { onSetLocalSuccess(pc1); }, onSetSessionDescriptionError ); trace('pc2 setRemoteDescription start'); pc2.setRemoteDescription(desc).then(() => { onSetRemoteSuccess(pc2); }, onSetSessionDescriptionError );

Callee

Crie pc2 e, quando o stream de pc1 for adicionado, mostre-o em um elemento de vídeo: js pc2 = new RTCPeerConnection(servers); pc2.ontrack = gotRemoteStream; //... function gotRemoteStream(e){ vid2.srcObject = e.stream; }

Servidores e API `RTCPeerConnection`

No mundo real, o WebRTC precisa de servidores, mesmo que simples, para que o seguinte possa acontecer:

Os usuários se descobrem e trocam detalhes do mundo real, como nomes.
Os apps cliente WebRTC (peers) trocam informações de rede.
Os participantes trocam dados sobre mídia, como formato e resolução de vídeo.
Os apps cliente do WebRTC atravessam gateways NAT e firewalls.

Em outras palavras, o WebRTC precisa de quatro tipos de funcionalidade do lado do servidor:

Descoberta e comunicação com o usuário
Sinalização
Travessia de NAT/firewall
Servidores de retransmissão em caso de falha na comunicação ponto a ponto

O NAT traversal, a rede ponto a ponto e os requisitos para criar um app de servidor para descoberta e sinalização de usuários estão além do escopo deste artigo. Basta dizer que o protocolo STUN e a extensão dele, TURN, são usados pela estrutura ICE para permitir que o RTCPeerConnection lide com a travessia de NAT e outras variações de rede.

O ICE é uma estrutura para conectar usuários, como dois clientes de chat por vídeo. Inicialmente, o ICE tenta conectar os participantes diretamente com a menor latência possível usando UDP. Nesse processo, os servidores STUN têm uma única tarefa: permitir que um peer atrás de um NAT descubra seu endereço e porta públicos. Para mais informações sobre STUN e TURN, consulte Criar os serviços de back-end necessários para um app WebRTC.

Se o UDP falhar, o ICE vai tentar o TCP. Se a conexão direta falhar, principalmente devido à travessia de NAT e aos firewalls corporativos, o ICE usará um servidor TURN intermediário (relay). Em outras palavras, o ICE primeiro usa STUN com UDP para conectar diretamente os peers e, se isso falhar, volta para um servidor de retransmissão TURN. A expressão encontrar candidatos se refere ao processo de encontrar interfaces e portas de rede.

O engenheiro do WebRTC Justin Uberti oferece mais informações sobre ICE, STUN e TURN na apresentação do WebRTC no Google I/O de 2013 (em inglês). Os slides da apresentação dão exemplos de implementações de servidores TURN e STUN.

Um cliente de chat por vídeo simples

Um bom lugar para testar o WebRTC, com travessia de sinalização e NAT/firewall usando um servidor STUN, é a demonstração de chat por vídeo em appr.tc. Esse app usa adapter.js, um shim para isolar apps de mudanças de especificação e diferenças de prefixo.

O código é propositalmente detalhado no registro. Confira o console para entender a ordem dos eventos. Confira a seguir uma explicação detalhada do código.

Topologias de rede

O WebRTC, na implementação atual, só oferece suporte à comunicação individual, mas pode ser usado em cenários de rede mais complexos, como com vários participantes que se comunicam diretamente ou por uma unidade de controle multiponto (MCU, na sigla em inglês), um servidor que pode processar um grande número de participantes e fazer encaminhamento seletivo de streams, além de mixagem ou gravação de áudio e vídeo.

Diagrama de topologia da unidade de controle multiponto — Exemplo de topologia de unidade de controle multiponto

Muitos apps WebRTC atuais demonstram apenas a comunicação entre navegadores da Web, mas os servidores de gateway podem permitir que um app WebRTC em execução em um navegador interaja com dispositivos, como telefones (também conhecidos como PSTN) e com sistemas VOIP. Em maio de 2012, a Doubango Telecom lançou o cliente SIP sipml5 (em inglês) de código aberto, criado com WebRTC e WebSocket, que (entre outros usos possíveis) permite chamadas de vídeo entre navegadores e apps executados no iOS e no Android. No Google I/O, a Tethr e a Tropo demonstraram um framework para comunicações em caso de desastre em uma pasta usando uma célula OpenBTS para permitir a comunicação entre smartphones comuns e computadores pelo WebRTC. Comunicação por telefone sem uma operadora!

Demonstração do Tethr/Tropo no Google I/O 2012 — Tethr/Tropo: comunicações de desastres em uma pasta

API `RTCDataChannel`<

Além de áudio e vídeo, o WebRTC oferece suporte à comunicação em tempo real para outros tipos de dados.

A API RTCDataChannel permite a troca ponto a ponto de dados arbitrários com baixa latência e alta capacidade de processamento. Para demonstrações de página única e aprender a criar um app simples de transferência de arquivos, consulte Exemplos de WebRTC e o codelab do WebRTC, respectivamente.

Há muitos casos de uso em potencial para a API, incluindo:

Jogos
Apps de área de trabalho remota
Chat de texto em tempo real
Transferência de arquivo
Redes descentralizadas

A API tem vários recursos para aproveitar ao máximo o RTCPeerConnection e permitir uma comunicação ponto a ponto eficiente e flexível:

Uso da configuração de sessão do RTCPeerConnection
Vários canais simultâneos com priorização
Semântica de entrega confiável e não confiável
Segurança integrada (DTLS) e controle de congestionamento
Capacidade de usar com ou sem áudio ou vídeo

A sintaxe é propositalmente semelhante ao WebSocket, com um método send() e um evento message:

const localConnection = new RTCPeerConnection(servers);
const remoteConnection = new RTCPeerConnection(servers);
const sendChannel =
  localConnection.createDataChannel('sendDataChannel');

// ...

remoteConnection.ondatachannel = (event) => {
  receiveChannel = event.channel;
  receiveChannel.onmessage = onReceiveMessage;
  receiveChannel.onopen = onReceiveChannelStateChange;
  receiveChannel.onclose = onReceiveChannelStateChange;
};

function onReceiveMessage(event) {
  document.querySelector("textarea#send").value = event.data;
}

document.querySelector("button#send").onclick = () => {
  var data = document.querySelector("textarea#send").value;
  sendChannel.send(data);
};

A comunicação ocorre diretamente entre navegadores. Por isso, o RTCDataChannel pode ser muito mais rápido que o WebSocket, mesmo que um servidor de retransmissão (TURN) seja necessário quando a perfuração de buracos para lidar com firewalls e NATs falha.

O RTCDataChannel está disponível no Chrome, Safari, Firefox, Opera e Samsung Internet. O jogo Cube Slam usa a API para comunicar o estado do jogo. Jogue com um amigo ou com o urso! A plataforma inovadora Sharefest permitiu o compartilhamento de arquivos por RTCDataChannel, e a peerCDN mostrou como o WebRTC poderia permitir a distribuição de conteúdo ponto a ponto.

Para mais informações sobre o RTCDataChannel, consulte a especificação de protocolo provisória do IETF.

Segurança

Há várias maneiras de um app ou plug-in de comunicação em tempo real comprometer a segurança. Exemplo:

Mídia ou dados não criptografados podem ser interceptados entre navegadores ou entre um navegador e um servidor.
Um app pode gravar e distribuir vídeo ou áudio sem que o usuário saiba.
Malware ou vírus podem ser instalados junto com um plug-in ou app aparentemente inofensivo.

O WebRTC tem vários recursos para evitar esses problemas:

As implementações do WebRTC usam protocolos seguros, como DTLS e SRTP.
A criptografia é obrigatória para todos os componentes do WebRTC, incluindo mecanismos de sinalização.
O WebRTC não é um plug-in. Os componentes dele são executados na sandbox do navegador, não em um processo separado. Os componentes não exigem instalação separada e são atualizados sempre que o navegador é atualizado.
O acesso à câmera e ao microfone precisa ser concedido explicitamente e, quando eles estão em execução, isso é mostrado claramente pela interface do usuário.

Uma discussão completa sobre a segurança de mídia de streaming está fora do escopo deste artigo. Para mais informações, consulte a Arquitetura de segurança do WebRTC proposta pelo IETF.

Conclusão

As APIs e os padrões do WebRTC podem democratizar e descentralizar ferramentas de criação de conteúdo e comunicação, incluindo telefonia, jogos, produção de vídeo, criação de música e coleta de notícias.

A tecnologia não fica muito mais disruptiva do que isso.

Como o blogueiro Phil Edholm disse, "Potencialmente, o WebRTC e o HTML5 podem permitir a mesma transformação para a comunicação em tempo real que o navegador original fez para as informações".

Ferramentas para desenvolvedores

As estatísticas do WebRTC de uma sessão em andamento podem ser encontradas em:
- about://webrtc-internals no Chrome
- opera://webrtc-internals no Opera
- about:webrtc no Firefox
  
  Captura de tela de chrome://webrtc-internals
Notas de interoperabilidade entre navegadores
O adapter.js é um shim JavaScript para WebRTC mantido pelo Google com a ajuda da comunidade WebRTC (em inglês) que abstrai prefixos de fornecedores, diferenças de navegadores e mudanças de especificações.
Para saber mais sobre os processos de sinalização do WebRTC, confira a saída do registro appr.tc no console.
Se tudo isso for demais, talvez seja melhor usar uma estrutura WebRTC ou até mesmo um serviço WebRTC completo.
Relatórios de bugs e pedidos de recursos são sempre bem-vindos:

Saiba mais

Sessão do WebRTC de Justin Uberti no Google I/O 2012
Alan B. Johnston e Daniel C. Burnett mantém um livro sobre WebRTC, agora na terceira edição em formatos impresso e e-book, em webrtcbook.com (link em inglês).
O site webrtc.org é o lar de tudo relacionado ao WebRTC, incluindo demonstrações, documentação e discussões.
discuss-webrtc é um grupo do Google para discussões técnicas sobre o WebRTC.
@webrtc
A documentação de conversas do Google Developers oferece mais informações sobre travessia de NAT, STUN, servidores de retransmissão e coleta de candidatos.
WebRTC no GitHub
O Stack Overflow é um bom lugar para procurar respostas e fazer perguntas sobre o WebRTC.

Padrões e protocolos

Rascunho do editor do W3C do WebRTC (em inglês)
Rascunho do editor do W3C: captura e fluxos de mídia (também conhecido como getUserMedia)
Termo de abertura do grupo de trabalho do IETF
Rascunho do protocolo de canal de dados WebRTC do IETF (em inglês)
Rascunho do JSEP da IETF
Padrão proposto pelo IETF para ICE
Rascunho da Internet do Grupo de Trabalho RTCWEB da IETF: Casos de uso e requisitos da Web Real-Time Communication

Resumo do suporte ao WebRTC

APIs `MediaStream` e `getUserMedia`

Chrome para computador 18.0.1008 e versões mais recentes; Chrome para Android 29 e versões mais recentes
Opera 18 e versões mais recentes; Opera para Android 20 e versões mais recentes
Opera 12 e Opera Mobile 12 (baseados no mecanismo Presto)
Firefox 17 e versões mais recentes
Microsoft Edge 16 e versões mais recentes
Safari 11.2 e versões mais recentes no iOS e 11.1 e versões mais recentes no MacOS
UC 11.8 e versões mais recentes no Android
Samsung Internet 4 e versões mais recentes

API `RTCPeerConnection`.

Chrome para computador 20 e versões mais recentes; Chrome para Android 29 e versões mais recentes (sem flags)
Opera 18 e versões mais recentes (ativado por padrão); Opera para Android 20 e versões mais recentes (ativado por padrão)
Firefox 22 e versões mais recentes (ativado por padrão)
Microsoft Edge 16 e versões mais recentes
Safari 11.2 e versões mais recentes no iOS e 11.1 e versões mais recentes no MacOS
Samsung Internet 4 e versões mais recentes

API `RTCDataChannel`.

Versão experimental no Chrome 25, mas mais estável (e com interoperabilidade do Firefox) no Chrome 26 e versões mais recentes; Chrome para Android 29 e versões mais recentes
Versão estável (e com interoperabilidade do Firefox) no Opera 18 e versões mais recentes; Opera para Android 20 e versões mais recentes
Firefox 22 e versões mais recentes (ativado por padrão)

Para mais informações sobre o suporte multiplataforma para APIs, como getUserMedia e RTCPeerConnection, consulte caniuse.com e Status da plataforma do Chrome.

As APIs nativas para RTCPeerConnection também estão disponíveis na documentação em webrtc.org.

Começar a usar o WebRTC Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Comunicação em tempo real sem plug-ins

Início rápido

Uma breve história do WebRTC

Onde estamos agora?

Seu primeiro WebRTC

API MediaStream (também conhecida como API getUserMedia)

Restrições

Captura de tela e guia

Sinalização: controle de sessão, rede e informações de mídia

RTCPeerConnection

RTCPeerConnection sem servidores

Autor da chamada

Callee

Servidores e API RTCPeerConnection

Um cliente de chat por vídeo simples

Topologias de rede

API RTCDataChannel<

Segurança

Conclusão

Ferramentas para desenvolvedores

Saiba mais

Padrões e protocolos

Resumo do suporte ao WebRTC

APIs MediaStream e getUserMedia

API RTCPeerConnection.

API RTCDataChannel.

Começar a usar o WebRTC

API `MediaStream` (também conhecida como API `getUserMedia`)

Servidores e API `RTCPeerConnection`

API `RTCDataChannel`<

APIs `MediaStream` e `getUserMedia`

API `RTCPeerConnection`.

API `RTCDataChannel`.