Quanto tempo você gasta para buscar uma informação de um campo XML? Se você utilizar o IMPORTXML, quase nada!
Quer aprender como usar IMPORTXML Google Sheets? Como importar XML pro Excel? Como usar a fórmula IMPORTXML?
Vem com a gente que temos todas as respostas!
A função IMPORTXML importa dados de qualquer um dos vários tipos de dados estruturados, como xml, HTML, CSV e TSV.
Em outras palavras, IMPORTXML google sheets permite importar dados de sites para fins de scraping de dados na web.
E como usar a fórmula IMPORTXML? Começamos pela sintaxe.
Para aprender como usar importxml google sheets é preciso conhecer sua sintaxe, veja:
=IMPORTXML(url, xpath_query)
Os argumentos presentes na sintaxe são:
Perceba que, para saber como usar importxml google sheets, você deve entender xPath, então vamos lá!
Tem como usar importxml google sheets sem conhecer Xpath? Não, você precisa saber ao menos o básico sobre essa linguagem de consulta.
De forma simples, o XPath nos ajuda a navegar por documentos que utilizam marcadores. É o caso dos arquivos XML e HTML.
Vamos pegar o HTML como exemplo. Nele, as informações ficam agrupadas em tags (<title>, <body>, etc.) que se organizam em uma espécie de esquema de arquivos e pastas. Os elementos são hierarquizados em uma visualização em árvore.
Você precisa navegar pelas hierarquias e níveis para encontrar o elemento que procura, certo? O XPath seria uma bússola para esta navegação. Ou seja, consegue localizar pontos específicos do documento HTML com “endereços“.
No IMPORTXML google sheets, o XPath vem para resolver o scraping de dados. Afinal, você não tem interesse em todos elementos de um website, mas somente em uma lista de nomes, um dado ou uma tabela específica.
Nós acabamos de ver a sintaxe da fórmula IMPORTXML. Para utilizá-la, precisamos ajustar o uso de cada argumento.
Ambos os argumentos devem ser incluídos entre aspas ou ser uma referência a uma célula que contenha o texto apropriado.
A consulta xpath (xpath_query) deve ser personalizada de acordo com o que você está procurando no site.
Além das aspas, existem outras regras para usar IMPORTXML google sheets:
Quer um exemplo simples de como importar XML para Google Sheets? Imagine que você quer identificar todas as cidades de São Paulo e suas regiões. Você usará o site da Wikipédia.
É inviável digitar as cidades manualmente, pois são centenas. Mas com a função IMPORTXML, é possível resolver o problema automaticamente. O passo a passo é básico:
Ok, aprendi como usar IMPORTXML google sheets. Mas como encontrar o XPath na página?
Para encontrar qual é o caminho XPath em uma página da web, você deve utilizar o WebInspector. É uma ferramenta de inspeção no navegador que acha o elemento e copia o XPath. O comando é o seguinte:
Selecione o texto que deseja copiar > botão direito do mouse > “Inspecionar Elemento” ou Ctrl + Shift + I > botão direito do mouse sobre o código HTML correspondente > “Copiar” > “Copiar XPath”.
Aprendeu como usar ImportXML? Ainda falta algo, certo? Precisamos saber como construir a consulta XPath e utilizar os operadores e expressões.
Para criar seu próprio argumento xpath_query, você deve saber:
Para que eu vou utilizar XPath? Existem muitas finalidades para essas consultas. Os profissionais de marketing, por exemplo, utilizam XPath de inúmeras maneiras, veja:
Além de utilizar o IMPORTXML Google Sheets, você pode optar por fazer a automação web pelo Excel e pelo Python.
O VBA Web Scraping no Excel cumpre o mesmo objetivo da função IMPORTXML: economizar o tempo do profissional na extração de informações de um site.
Com o Excel, você consegue coletar dados de fontes mais precisas, validar hipóteses e resultados e gerar ideias valiosas de negócio.
Conheça nosso minicurso de Automação WEB em VBA!
Utilizar o Python para automação e webscraping também é uma ótima maneira de facilitar a sua vida para evitar ações repetitivas.
Para isso, você precisará utilizar o Selenium, uma biblioteca que permite ao Python abrir o navegador para executar os comandos.
A interação do Python com o Selenium precisa de um webdriver, ok? Essa é só uma noção de que é possível fazer automação web fora do Google Sheets.
Quer conhecer melhor a ferramenta? Aprenda Python em um Minicurso Gratuito!
Expert em conteúdos da Hashtag Treinamentos. Auxilia na criação de conteúdos de variados temas voltados para aqueles que acompanham nossos canais.