BinaryWorks.it Official Forum
Home
|
Profile
|
Register
|
Active Topics
|
Members
|
Search
|
FAQ
All Forums
eXtreme Movie Manager 8, 9, 10 Forum
Scripts
IMDb API & Web Scraping
Note:
Only the poster of this message, and the Moderator can edit the message.
Screensize:
640 x 480
800 x 600
1024 x 768
1280 x 1024
UserName:
Password:
Format Mode:
Basic
Help
Prompt
Format:
Font
Andale Mono
Arial
Arial Black
Book Antiqua
Century Gothic
Comic Sans MS
Courier New
Georgia
Impact
Lucida Console
Script MT Bold
Stencil
Tahoma
Times New Roman
Trebuchet MS
Verdana
Size
1
2
3
4
5
6
Color
Black
Red
Yellow
Pink
Green
Orange
Purple
Blue
Beige
Brown
Teal
Navy
Maroon
LimeGreen
Message:
* HTML is OFF
*
Forum Code
is ON
Smilies
Überall dort, wo "See more" / "All" auftaucht, steckt eine JSON-Abfrage dahinter, die ich in meiner Library implementiert habe, um mit einem JSON-Request alle Einträge auf einmal zu ziehen, was auch flinker als ein HTML-Request ist. Meine Erklärung im Eingangsbeitrag (Nachbildung eines Browsers und Klicken auf die Buttons) ist dahingehend viel umständlicher und dauert auch 10x länger. Ferner sind die JSON-Strukturen, die man durch den JSON-Request zurückerhält besser/strukturierter zu parsen als HTML-Seiten, die von Tracking- und Verschleierungsscripten sowie Stilisierungsformatierungen durchsetzt sind. Dort, wo ich HTML-Requests brauche, habe ich daher sehr viel davon ausgefiltert, um überhaupt vernünftig parsen zu können. Letztlich holt meine Library aber so ziemlich alle Daten zu einem Titel raus. Schau dir die Bilderchen an, um zu sehen, was ich da umgesetzt habe: https://github.com/tardezyx/tar.IMDbScraper/tree/main/Images Es wäre also völliger Blödsinn, meine Library dafür nutzen zu wollen, die HTML- oder JSON-Responses zu exportieren, weil die Daten bereits entsprechend daraus gezogen werden. Anderenfalls wäre es ja auch kein IMDb Scraper, sondern lediglich irgendeine Art "WebRequest-Exporter".
Check here to include your profile signature.
BinaryWorks.it Official Forum
© Binaryworks.it
Generated in 0.03 sec.