BinaryWorks.it Official Forum
Home
|
Profile
|
Register
|
Active Topics
|
Members
|
Search
|
FAQ
All Forums
eXtreme Movie Manager 8, 9, 10 Forum
Scripts
IMDb API & Web Scraping
Note:
Only the poster of this message, and the Moderator can edit the message.
Screensize:
640 x 480
800 x 600
1024 x 768
1280 x 1024
UserName:
Password:
Format Mode:
Basic
Help
Prompt
Format:
Font
Andale Mono
Arial
Arial Black
Book Antiqua
Century Gothic
Comic Sans MS
Courier New
Georgia
Impact
Lucida Console
Script MT Bold
Stencil
Tahoma
Times New Roman
Trebuchet MS
Verdana
Size
1
2
3
4
5
6
Color
Black
Red
Yellow
Pink
Green
Orange
Purple
Blue
Beige
Brown
Teal
Navy
Maroon
LimeGreen
Message:
* HTML is OFF
*
Forum Code
is ON
Smilies
Ich habe dir mal g'schwind was gebastelt: https://github.com/tardezyx/tar.IMDbScraper/releases/download/1.1.0/tar.IMDbExporter.zip Lade dir dazu Visual Studio herunter: https://visualstudio.microsoft.com/de/vs/ Entpacke und öffne mein Programm in Visual Studio und führe es einfach mal aus (mit F5). Export-Folder: hier werden Dateien abgelegt. IMDb-ID: selbsterklärend. Wenn du auf Process klickst, werden ein paar Scraper-Methoden ausgeführt (ich hab jene genommen, die du als relevant genannt hast). Danach werden die Daten aufbereitet - ich habe hier nur mal die alternativen Titel (sind auf IMDb bei der ReleaseInfo zu sehen) so aufbereitet, dass alle vorhandenen "<CountryID>: <AlternateTitle>" untereinander aufgeführt werden. Zuguterletzt wird die Aufbereitung exportiert, d.h. in eine Text-Datei namens <IMDb-ID>.txt ins Export-Verzeichnis weggeschrieben. Zur Anpassung ist für dich folgendes relevant: 1. Doppelklicke auf Gui -> MainForm.cs und dort dann auf den "Process"-Button. Dann landest du in der relevanten Methode, wo du unter " --- daten aufbereiten ------" deine Sachen ergänzen kannst. 2. Falls du noch andere Dinge scrapen willst, kannst du einfach die weiteren Scraper-Methoden nutzen (sind alle statisch). 3. Der StringBuilder ist eine Art Hilfs-String. Den nimmt man, um Ressourcen zu schonen. Du kannst für deine Belange auch direkt string nehmen. 4. Die Zeile "alternateTitles = alternateTitles.OrderBy(x => x.Country?.ID).ToList();" sortiert die alternativen Titel nochmal nach Ländercode. Das x => x.Country usw. ist dabei Linq-Syntax und im Grunde nichts anderes als eine Art SELECT, hier wird eben Country.ID ausgewählt. Das ? nach Country ist ein Check, ob Country NULL ist - dürfte in diesem Fall nie vorkommen, da immer ein Land vorhanden sein sollte. ToList() am Ende ist notwendig, damit es wieder eine Liste wird. 5. Async wird für asynchrones Arbeiten genutzt, so dass auch die Gui responsive bleibt, da die Arbeiten in andere Tasks verlagert werden. D.h. aber auch, dass du momentan mehrfach den Process-Button drücken kannst und er das mehrfach ausführt (hier müsste man während er werkelt den Button noch deaktivieren - kannst du ja ergänzen). 6. Für die ProgressBar (die Anzeige unten) dient die Methode Scraper_ProgressUpdate. Das ist etwas komplexer und kannst du erstmal ignorieren. Den Rest solltest du kennen.
Check here to include your profile signature.
BinaryWorks.it Official Forum
© Binaryworks.it
Generated in 0.02 sec.