Uma URL pode consistir em várias partes diferentes. Há um nome de host que é mapeado para um endereço IP de um recurso específico na Internet e várias informações adicionais que informam ao navegador e ao servidor como lidar com as coisas. Você pode pensar em um endereço IP como algo parecido com um número de telefone. Um nome de host é como o nome de uma pessoa cujo número de telefone você deseja procurar. E um padrão chamado Sistema de Nomes de Domínio (DNS) funciona em segundo plano, como uma lista telefônica, traduzindo os nomes de host mais humanos para os endereços IP que as redes usam para rotear o tráfego.
Com essa analogia em mente, vamos dar uma olhada na estrutura de um URL e em como ele funciona para chegar aonde você deseja ir.
Como um URL é estruturado
A estrutura de uma URL foi definida pela primeira vez por Sir Tim Berners-Lee - o cara que criou a Web e o primeiro navegador da Web - em 1994. As URLs essencialmente combinam a ideia de nomes de domínio com a ideia de usar um caminho de arquivo para identificar pasta e estrutura de arquivos. Portanto, é semelhante a usar um caminho como C: Documents Personal myfile.txt no Windows, mas com algumas coisas extras no começo para ajudar a encontrar o servidor certo na Internet onde esse caminho existe e o protocolo usado para acessar o em formação.
Um URL consiste em várias partes diferentes. Tomemos, por exemplo, um URL básico como o mostrado na imagem abaixo.
Esquema
Muitas pessoas pensam em um URL como apenas um endereço da Web, mas não é tão simples assim. Um endereço da web é um URL, mas todos os URLs não são endereços da web. Outros serviços que você pode acessar na internet, como o FTP, ou mesmo localmente, como o MAILTO, também são URLs. A parte do esquema de uma URL (aquelas letras seguidas por dois pontos) denota o protocolo com o qual um aplicativo (como seu navegador da Web) e o servidor devem se comunicar.
Os endereços da Web são o URL mais comum, mas há outros. Então, você pode ver esquemas como:
- HyperText Transfer Protocol (HTTP): este é o protocolo subjacente da web e determina quais ações os servidores e navegadores da Web devem executar em resposta a determinados comandos.
- HTTP Secure (HTTPS): Esta é uma forma de HTTP que funciona através de uma camada segura e criptografada para um transporte de informações mais seguro.
- Protocolo de transferência de arquivos (FTP): esse protocolo geralmente é usado para transferir arquivos pela Internet.
Nos navegadores modernos, o esquema não é tecnicamente obrigatório como parte do URL. Se você entrar em um site como "www.howtogeek.com", seu navegador determinará automaticamente o protocolo correto a ser usado. Ainda assim, alguns outros aplicativos (e protocolos) exigem o uso de um esquema.
Autoridade
A parte de autoridade de uma URL (que é precedida por duas barras) é dividida em várias partes. Vamos começar com um URL muito simples - o tipo que levaria você à home page de um website.
Mas, ao analisar o nome do host, ajuda a lê-lo para trás para entender o que está acontecendo, então aqui estão esses componentes:
- Domínio de nível superior: No exemplo aqui, "com" é o domínio de nível superior. Esses são os níveis mais altos da hierarquia do Sistema de Nomes de Domínio (DNS) usados para traduzir endereços IP em endereços de idioma simples, que são mais fáceis de serem lembrados por nós. Esses domínios de nível superior são criados e gerenciados pela Corporação da Internet para Atribuição de Nomes e Números (ICANN). Os três domínios de primeiro nível mais comuns são.com,.net e.gov. A maioria dos países também tem seu próprio domínio de nível superior com duas letras, portanto, você verá domínios como.us (Estados Unidos),.uk (Reino Unido),.ca (Canadá) e muitos outros. Há também alguns domínios de nível superior adicionais (como.museum) que são patrocinados e gerenciados por organizações privadas. Além desses, existem também alguns domínios genéricos de primeiro nível (como.club,.life e.news).
- Subdomínio: Como o DNS é um sistema hierárquico, as partes "www" e "example" do nosso URL de exemplo são consideradas subdomínios. A parte "www" é um subdomínio do domínio de nível superior "com" e a parte "www" é um subdomínio do domínio "exemplo". É por isso que você frequentemente vê uma empresa com um nome registrado como "google.com" dividido em subdomínios separados, como "www.google.com", "news.google.com", "mail.google.com" e em breve.
Esse é o exemplo mais básico da seção de autoridade de um URL, mas as coisas podem ficar mais complicadas. Existem dois outros componentes que a seção de autoridade pode conter:
- Informação do usuário: A seção de autoridade também pode conter um nome de usuário e uma senha para o site que você está acessando. É incomum ver essa estrutura em URLs hoje, mas isso pode acontecer. Se presente, a parte da informação do usuário vem antes do nome do host e é seguida por um sinal @.Então, você pode ver algo como "//username:[email protected]" se incluir as informações do usuário.
- Número da porta: Dispositivos de rede usam endereços IP para obter informações para o computador certo em uma rede. Quando esse tráfego chega, um número de porta informa ao computador o aplicativo para o qual esse tráfego é destinado. O número da porta é outro elemento que você normalmente não vê quando navega na Web, mas pode vê-lo em aplicativos de rede (como jogos) que exigem a inserção de um URL. Se o URL incluir um número de porta, ele vem depois do nome do host e é precedido por dois pontos. Seria algo como isto: "//www.example.com:8080".
Então, essas são as partes do esquema e da autoridade de um URL, mas, como você deve ter adivinhado depois de observar muitos URLs enquanto navega na Web, eles podem incluir ainda mais coisas.
Caminhos, consultas e fragmentos
Há três partes adicionais de uma URL que você pode ver após a parte da autoridade: caminhos, consultas e fragmentos. Veja como isso funciona.
Caminho
A seção de autoridade de um URL obtém seu navegador (ou qualquer aplicativo) para o servidor correto em uma rede. O caminho a seguir - que funciona exatamente como um caminho no Windows, no MacOS ou no Linux - leva você à pasta ou arquivo corretos nesse servidor. O caminho é precedido por uma barra, e há uma barra entre cada diretório e subdiretório, assim:
www.example.com/folder/subfolder/filename.html
A última parte é o nome do arquivo que é aberto quando você acessa o site. Embora você possa não vê-lo na barra de endereço, isso não significa que ele não esteja lá. Alguns idiomas usados para criar páginas da Web ocultam o nome do arquivo e a extensão que você está visualizando. Isso torna a URL mais fácil de lembrar e digitar e dá uma aparência mais clara.
Inquerir
A parte da consulta de um URL é usada para identificar coisas que não fazem parte de uma estrutura de caminho restrita. Na maioria das vezes, você os verá quando fizer uma pesquisa ou quando uma página da Web fornecer dados por meio de um formulário. A parte da consulta é precedida por um ponto de interrogação e vem depois do caminho (ou após o nome do host, se um caminho não estiver incluído).
Por exemplo, leve este URL apresentado quando pesquisamos a Amazon para as palavras-chave "extensor wi-fi":
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
O formulário de pesquisa passou informações para o mecanismo de pesquisa da Amazon. Após o ponto de interrogação, você pode ver que existem duas partes na consulta: uma URL para a pesquisa (que é a parte "url = search-alias% 3Daps &field") e as palavras-chave que digitamos (essa é a palavra-chave = wi-fi + extensor”parte).
Esse é um exemplo bastante simples e você verá frequentemente URLs com variáveis adicionais (e mais complicadas). Por exemplo, aqui está o URL quando pesquisamos no Google a palavra-chave "howtogeek":
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Como você pode ver, há algumas informações diferentes. Nesse caso, você pode ver que há informações adicionais indicando o idioma da pesquisa, o navegador que usamos (Chrome) e até o número da versão do navegador.
Fragmento
O componente final de uma URL que você pode ver é chamado de fragmento. O fragmento é precedido por uma marca de hash (#) e é usado para indicar um local específico em uma página da web. Ao codificar uma página da Web, os designers podem criar âncoras para textos específicos, como títulos. Quando o fragmento adequado é usado no final de um URL, o navegador carrega a página e, em seguida, pula para essa âncora. Âncoras e URLs com fragmentos geralmente são usados para criar tabelas de conteúdo em páginas da Web para facilitar a navegação.
Aqui está um exemplo. A página da Wikipédia sobre o Renascimento é um documento bastante longo e está dividida em cerca de 11 seções, cada uma com várias subseções. Mas cada título na página tem uma âncora incluída e um índice na parte superior do artigo inclui links que permitem saltar para as diferentes seções. Esses links funcionam incluindo fragmentos.
Você também pode usar esses fragmentos diretamente em sua barra de endereço ou como links compartilháveis. Digamos, por exemplo, que você queria mostrar a alguém a seção dessa página que cobre a Rússia. Você poderia apenas enviar-lhes este link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Essa parte “# Rússia” no final do URL os leva diretamente para aquela seção depois de carregar a página.
Então você tem isso - mais do que você provavelmente já quis saber sobre como os URLs funcionam.