2013. november 19., kedd

HTML output plugin Crawljax-hoz

Csináltam egy HTML output plugint Crawljax-hoz, ami a következőket tudja:
  • minden DOM állapotot fájlba ment (OnNewStatePlugin)
  • minden állapotot csak egyszer ment le
  • a fájlnevet és a fájl helyét (mappaszerkezet) az URL alapján generálja, tehát egy mirrort kapunk
  • ha egy URL-en több DOM jönne be, akkor számlálót tesz a fájlnév végére
A fájlnév generálásához az URL2File osztályomat használja, amely biztosítja a .html kiterjesztést.

GitHub-on megtalálod, bővebb leírással. :-)

Nincsenek megjegyzések: