Saudações!
Temos o prazer de anunciar uma nova funcionalidade para o Rocket Validator que acreditamos que tornará os seus relatórios de validação de site mais precisos.
Como sabe, o nosso scraper encontra e inclui automaticamente páginas web internas seguindo links. No entanto, se preferir ter mais controlo sobre os URLs incluídos nos seus relatórios, pode usar um sitemap XML ou TXT com URLs específicos ou desativar o crawling profundo para restringir o âmbito.
Por vezes, no entanto, pode querer excluir determinados URLs dos seus relatórios, mas criar um sitemap de links pode não ser viável. É por isso que introduzimos exclusões de caminho de URL. Agora pode definir caminhos que pretende excluir dos seus relatórios com facilidade.
Digamos que quer executar um relatório de validação de site no Github Blog, mas deseja excluir todos os URLs de “author” e “category” desse relatório específico. É uma tarefa simples. Tudo o que precisa de fazer é incluir esses caminhos no formulário New Report conforme mostrado abaixo:
github.blog/author/
github.blog/category/
As exclusões de caminho podem ser tão simples como uma substring, tal como “author” para o primeiro URL e “category” para o segundo. No entanto, para evitar falsos positivos, recomendamos que inclua também o domínio.
Uma vez que defina as exclusões e execute o relatório, o scraper irá automaticamente ignorar os URLs correspondentes e excluí-los do relatório.
Pode ver os URLs excluídos clicando no ícone do ponto de interrogação no aviso apresentado sobre a lista de páginas web.
Pode definir exclusões em Schedules e também geri-las através da API. As exclusões também estão incluídas quando você descarrega relatórios como ficheiros Excel.
Esperamos que esta funcionalidade lhe seja útil e melhore a sua experiência com o Rocket Validator!