Запазване на данни от интернет страници, блог Sammy

В тази статия ще ви опиша изпълнението на една единствена идея по няколко начина.

Преценете сами кой вариант сте избрали. Ще отидем в последователност на Yandex, Google и Bing, да отправи искане "да купи слон" и съхранява резултатите от папка.

Нека започнем с iMacros.

За тези, които не са "в обект», Imacros съхранява данните в папката по подразбиране. Вижте къде тя постави нов път, или можете, както е показано на снимките.

1) натисне бутона "Опции" на Imacros панел.

Запазване на данни от интернет страници, блог Sammy

2) Изберете раздела "Пътят" - там ще бъдат определени пътя си, за да запазите папката.

Запазване на данни от интернет страници, блог Sammy

Сега направи същото нещо в AutoIt:

Първите библиотеки линия връзка. Във втория ред получаваме HTML код на страницата. Третият ред поддържа всички Yandex-search.html файл в папката, където се провежда сценария.

Всичко е едно и също, просто различен името на файла.

В този пример, че е необходимо да конвертирате кирилицата в HTML кода, за да Бинг на "разбират" това, което трябва.

Ако използвате браузъра, е допустимо да се направи, ако сценарият "млъкни" на кирилица.

Както сте забелязали, размерът на скрипт AutoIt много по-кратък, отколкото в iMacros. В допълнение, сценарият Imacros неподвижно свързани към оформлението на сайта и когато тя се променя тя трябва да бъде повторно прекроявам.

Скриптове за AutoIt, показани в примера по-горе, като цяло не са обвързани с оформлението на сайта и работата във фонов режим, без това да пречи на браузъра. AutoIt скрипт може да бъде превърнат в .exe файл и да стартирате време от планировчика на заден план.

Е, и най-накрая да го продаде в Bash скрипт, който работи под Linux:

Yandex, Google, Bing - 3 в един файл

Bash скрипт да работи без да се позовава на браузъра. Въпреки, че кодът е трябвало да подражават на потребителския агент и бисквитки, за да "мамят" тези сайтове. Също така, този скрипт може да се изпълнява на короната (време) на заден план.

Това е, което имах нужда да завърши тази задача:

  • На Imacros - прозорци + Mozilla Firefox + imacros за Firefox
  • На AutoIt - прозорци + AutoIt
  • В Баш - Всяка Linux + Wget

Сходни публикации:

навигация в публикациите

2 мисли за "Запис на данни от сайтовете"