Text Mining 人民日报图文数据库（1946-2022）

anon45885675 · 16. August 2022 um 17:42

Guten Tag,
Ich wollte mich erkundigen, inwiefern es möglich ist, die Datenbank 人民日报图文数据库（1946-2022）für Verfahren des Text Mining zu verwenden. Auf der Website der Staatsbibliothek Berlin wird zwar darauf verwiesen, dass solche Anwendungen im Falle bestimmter Datensätze grundsätzlich erlaubt sind, wie es nun aber um diese Datenbank im Einzelnen steht, habe ich leider selbstständig nicht herausgefunden.
Ist das denn hier auch möglich und falls ja, unter welchen Bedingungen?
Ganz herzlichen Dank schon im voraus!
Herzlich,
Tim Salzer

msiebert · 18. August 2022 um 11:30

Hallo,

vielen Dank für Ihr Interesse an den CrossAsia Ressourcen!

Textmining ist grundsätzlich für beide People’s Daily Datenbanken in CrossAsia (http://erf.sbb.spk-berlin.de/han/RenminRibao1/ und http://erf.sbb.spk-berlin.de/han/rmrb-rmw) möglich, da hier der CrossAsia Standardvertrag (https://blog.crossasia.org/about/lizenzierung/) vereinbart werden konnte. Wichtige Voraussetzung: Sie müssen ein authentifizierter CrossAsia-Nutzer sein, d.h., eine Institution, die mit uns einen Vertrag hat (die sehen Sie in der Registrierung in der Auswahl aufgelistet), muss Ihr Registrierungsformular abstempeln. Wie das dann genau laufen kann, bzw. was genau hier Ihre Anforderungen sind, können wir dann vielleicht einfacher per E-Mail (x-asia@sbb.spk-berlin.de) besprechen.
Die vereinbarten Textmining-Rechte erlauben uns derzeit nicht, Ihnen komplette Abzüge der Daten zukommen zu lassen, damit Sie auf Ihrem privaten Rechner damit arbeiten können. Aber es gibt bereits einige andere Wege, wie wir diese Art von Arbeiten unseren Nutzern ermöglichen können.

Auf Basis der Daten der RMRB 1949-2012 bieten wir im CrossAsia ITR Explorer auch die Möglichkeit „frei“ (ohne CrossAsia Account oder Authentifizierung) komplexe Suchabfragen und Visualisierungen zu erstellen. Wählen Sie dazu z.B. unter „Select Source“ die Renmin Ribao als zu durchsuchende Quelle aus.

Ich hoffe, das beantwortet erst einmal grob Ihre Anfrage?
Herzlichen Gruß,
Martina Siebert