Semalt: Истихроҷи маълумот бо веби Google Chrome Plugin

Агар шумо барои ҷустуҷӯи шабака Google Chrome браузер истифода баред, барои ворид кардани маълумот аз сафҳаҳои дӯстдоштаи худ плагини браузер мавҷуд аст. Google Chrome Scraper як нармафзорест, ки барои ба даст овардани маълумот аз сайтҳои динамикӣ ва статикӣ истифода мешавад. Васлкунаки ин Chrome ба шумо имкон медиҳад, ки мӯҳтавои веби дӯстдоштаро пора кунед ва онро дар Google Docs нигоҳ доред.

Google Chrome Web Scraper

Google Chrome Web Scraper як браузери васеъшаванда мебошад, ки маълумотро аз сайтҳо ва саҳифаҳо мебарорад. Бо ин паҳнкунӣ, ба шумо садҳо коргар лозим нест, ки тамоми рӯзро аз сайт нусхабардорӣ кунанд. Пас аз насб дар браузери Chrome шумо, танҳо шумо бояд кореро интихоб кунед, ки мундариҷаи мақсаднокро интихоб кунед ва ба веб скрепер монед .

Агар шумо дониши рамзгузорӣ надошта бошед, ин беҳтарин веб скрепер аст, ки бояд ба назар гирифта шавад. Google Chrome Scraper барои ҳам миқдори ҳам калон ва ҳам калонҳаҷм тавсия дода мешавад. Он аз иттилоот ва маълумоти арзишманд иборат аст, ки ба иттилооти рақобатии рақобат мубаддал шудан мумкин аст. Бо ин васеъкунӣ ҳамаи тасвирҳо ва директорияҳои мақсадноки шумо ба осонӣ истихроҷ ва ба CouchDB ё ҷадвалҳо содир карда мешаванд.

Роҳнамоҳо дар бораи чӣ гуна шурӯъ кардан

Пур кардани сафҳаҳои веб бо плагини браузер ин як кори худ-худ аст, ки шумо метавонед бо компютери худ зуд иҷро кунед. Ин дастури ниҳоӣ аст, ки ба шумо барои оғоз кардан кӯмак мерасонад:

  • Браузери Google Chrome-и худро оғоз кунед ва "Веб Дӯкони Chrome" -ро клик кунед.
  • Васеъшавии браузери худро кушоед ва "Scraper" -ро ҷустуҷӯ кунед.
  • Опсияи "Илова ба Chrome" -ро, ки дар экран нишон дода шудааст, клик кунед
  • Вебсайт ё веб-саҳифаро кушоед, то ки ғорат шавад ва маълумоти ба дастовардаро қайд кунед. Элементро бо пои рости муш пахш кунед ва "Scrape similar." -Ро клик кунед.
  • Дар экрани шумо як консол скрепер пайдо мешавад. Дар хотир доред, ки консоли скрепер веб аз маълумоти ҳосилшуда иборат аст.
  • Дар ин марҳила, шумо метавонед дар куҷо нигоҳ доштани мундариҷаи шикасташудаи худро интихоб кунед. Масалан, шумо метавонед мундариҷаро дар Google Docs бо кнопкаи "Ҳифз ба ҳуҷҷатҳои Google" захира кунед.

Дар хотир доред, ки "скрепер" скрипти худкор аст, ки аз маълумоти муфид аз сафҳаҳои вебсайт ва сайтҳо истихроҷ мекунад. Бар хилофи дигар воситаҳои скреперҳои веб, скрепери Google Chrome инчунин инчунин метавонад маълумотҳои бо JavaScript эҷодшударо канда гирад . Дигар вазифаҳое, ки аз ҷониби Васлкунаки Chrome скрепер иҷро карда мешаванд, инҳоянд:

  • Клик кардани тугмаҳои мундариҷа барои пур кардани маълумот;
  • Пахш кардани тугмаҳои даврзанӣ, ки бо истифода аз AJAX маълумотро пур мекунанд;
  • Барои бор кардани мундариҷаи бештар веб саҳифаро ба поён ҳаракат кунед;
  • Интизорӣ дар бор кардани мундариҷаи динамикӣ дар веб саҳифа;

Пас аз поршани маълумот аз веб саҳифа, шумо метавонед ин маълумотро дар формати бо вергул ҷудошуда (CSV) зеркашӣ кунед ё дар CouchDB нигоҳ доред. Бо Google Chrome Web Scraper, ба шумо лозим нест, ки оид ба истихроҷи маълумот, сохтани нақша ё содирот кор кунед.

mass gmail