Rastreio automatizado de páginas

De Safeval Wiki
Ir para: navegação, pesquisa

O rastreio automatizado de páginas é uma etapa do teste de invasão que inicia-se com a montagem de uma requisição básica a URL inicial definida na tela de propriedades do teste de invasão.

Task crawl page 1 pt.png

Essa primeira requisição é então tratada da seguinte forma:

  • Primeiro guarda-se os cookies e verifica-se o cookie de sessão.
  • Todas as informações da requisição são registradas para revisão posterior.
  • Verifica-se links na página, usando parser HTML padrão.
  • Verifica-se formulários, iframes e outras estruturas de referência.
  • Todo o código javascript é executado, verificando-se a geração de alteração do location, acesso ajax e montagem de URLs.
  • Verifica-se o meta-refresh, location e outras formas de indicação de desvio.
  • Uma verificação de qualquer string com potencial de ser uma URL também é realizada.

Após o rastreio da página, o Safeval registra esta página para o teste, com os parâmetros da QUERY e do POST, para o teste. O servidor, se ainda não estiver na lista de servidores para teste, é incluso nesta lista. Da mesma forma, quaisquer diretórios identificados também são marcados para teste.

A lista dos links da página passa pelo filtro do escopo, os links restantes são inclusos para rastreio posterior.

Além dos links normais, para cada servidor e diretório identificado na URL, busca-se arquivos robots.txt e sitemap.xml, que podem conter informações de rastreamento.

A partir daí, para cada link segue-se o mesmo processo. Monta-se a requisição com os cookies e demais informações indicadas no link original, seguindo o mesmo procedimento para cada página até que nenhuma página nova, dentro do escopo definido, exista.

Para cada link rastreado é criada uma tarefa de execução deste tipo.