Come estrarre collegamenti da una pagina Web in Windows

Potrebbe essere necessario estrarre i collegamenti (URL) in una pagina Web per scopi diversi, ad esempio ricerca in Internet, sviluppo Web, valutazioni di sicurezza o test di pagine Web. Questo articolo spiega come estrarre i collegamenti da una pagina Web o un documento HTML in Windows.

Come estrarre collegamenti da una pagina Web in Windows

Esistono diversi metodi per estrarre gli URL in una pagina Web. Cominciamo con un modo nativo - usando la sezione degli strumenti di sviluppo del tuo browser web.

Utilizzo degli strumenti per sviluppatori del browser Web

  1. Apri Chrome per Firefox e visita prima il sito Web o la pagina Web.
  2. Premi F12 per aprire la finestra Strumenti per sviluppatori.
  3. Fai clic sulla scheda Console in Strumenti per gli sviluppatori.
  4. Cancella l'output della console facendo clic sul pulsante Clear console (in Chrome) o Clear the Web output (in Firefox).
  5. Digitare il seguente codice al prompt della console:
     Array.prototype.slice.call (document.querySelectorAll ('a'), 0) .forEach ((a, i) => console.log (`# $ {i + 1} - $ {a.innerText} - $ {} a.href `)); 

In questo modo viene visualizzato l'elenco ordinato di collegamenti in quella pagina Web insieme al titolo nella finestra della console.

Se vuoi solo prendere gli URL senza il numero seriale o il testo del titolo, usa questo comando:

 urls = $$ ('a'); for (url in urls) console.log (urls [url] .href); 

Copia l'output su Blocco note e salvalo.


Utilizzando PowerShell

Avviare PowerShell e utilizzare la sintassi della riga di comando seguente:

 (Invoke-WebRequest -Uri "//www.winhelponline.com/blog").Links.Href | Sort-Object | Get-Unique | Out-GridView 

Ciò ottiene l'elenco di collegamenti nella pagina Web specificata e restituisce l'elenco al controllo della vista griglia.

Un altro vantaggio di questo comando di PowerShell è che ordina le voci e rimuove anche gli URL duplicati dalla raccolta.

Il controllo vista griglia ti consente di filtrare la ricerca per parole chiave degli URL e di copiare gli elenchi negli Appunti usando Ctrl + C

Prendi titolo e URL

Per visualizzare il testo interno oltre ai collegamenti o URL corrispondenti, eseguire:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-List innerText, href 

Otterrai un output come questo:

Gli URL duplicati vengono rimossi automaticamente nell'output.

Puoi persino copiare l'output negli Appunti automaticamente usando | clip parametro | clip :

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-List innerText, href | clip 

Prendi solo gli URL delle immagini

Per estrarre l'elenco di URL di immagini, utilizzare questa sintassi:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Images | Select-Object src 


Utilizzando AddrView da Nirsoft

Lo strumento AddrView di Nirsoft estrae automaticamente i collegamenti (inclusi i collegamenti alle immagini) da una determinata pagina Web o un file HTML locale e li elenca in una vista a griglia.

Puoi persino ordinare i risultati per Tipo e copiare solo gli URL delle immagini negli Appunti o salvarli in un file.

Se vuoi solo afferrare i collegamenti alle immagini, puoi utilizzare l'opzione Informazioni sulla pagina di visualizzazione integrata di Firefox. In Firefox, fai clic con il pulsante destro del mouse sulla pagina Web corrente, fai clic su Visualizza informazioni sulla pagina → Media. La scheda Media elenca tutti gli URL delle immagini, inclusi i data:image collegamenti alle data:image . È possibile copiare gli elementi selezionati o tutti gli elementi negli Appunti o salvare le voci in un file.

Oltre ai metodi di cui sopra, per browser come Chrome o Firefox, ci sono molte estensioni o componenti aggiuntivi che cattureranno i collegamenti URL o immagine dalla pagina Web attualmente attiva nel browser.

$config[ads_text6] not found

Articoli Correlati