Internet

So archivieren Sie Ihre Online-Artikel

Autor: Peter Berry
Erstelldatum: 17 Juli 2021
Aktualisierungsdatum: 15 November 2024
Anonim
Die Symbolleiste für die Archivierung in TAIFUN
Video: Die Symbolleiste für die Archivierung in TAIFUN

Inhalt

Ron ist ein pensionierter Ingenieur und Manager für IBM und andere High-Tech-Unternehmen. Er schreibt ausführlich und ausführlich über moderne Technologie.

Als das Yahoo Contributor Network (YCN) 2014 geschlossen wurde, wurden mehr als hundert Artikel auf der Website veröffentlicht. Wenn ich nicht etwas getan habe, um diese Schatzkammer zu bewahren (zumindest habe ich das so gesehen), würde all dieser Inhalt einfach verschwinden, wenn die YCN-Site verschwindet.

Um sicherzustellen, dass dies nicht passiert, wollte ich ein Online-Archiv meiner Artikel erstellen, in dem sie fast genau in der Form verfügbar sind, in der sie auf der YCN-Website erscheinen.

Da ich wusste, dass einige dieser Artikel bereits gestohlen und auf betrügerischen Websites erneut veröffentlicht wurden, musste mein Archiv online verfügbar sein. Auf diese Weise könnte ich einfach einen Link zu meinem ursprünglichen Inhalt bereitstellen, um den Nachweis der Urheberschaft bei der Einreichung von DMCA-Beschwerden über Urheberrechtsverletzungen zu erbringen.


Andererseits musste ich sicherstellen, dass mein Archiv bei Websuchen über Google, Bing oder andere Suchmaschinen nicht als doppelter Inhalt angezeigt wird, da ich einen Teil dieser Arbeit auf anderen Schreibseiten erneut veröffentlichen würde.

Da ich bereits eine selbst gehostete WordPress-Website hatte, auf der ich meine Dateien speichern konnte, musste ich nur herausfinden, wie ich meine Artikel übertragen kann, damit beide ihr ursprüngliches Erscheinungsbild behalten und nicht von Suchmaschinen aufgelistet werden.

Nach einigem Ausprobieren habe ich mir einen dreistufigen Prozess ausgedacht, um ein solches Archiv zu erstellen, und ich dachte, es könnte für andere Online-Autoren nützlich sein, zu wissen, was ich getan habe. Die Schritte sind:

1. Kopieren Sie Ihre Artikelwebseiten auf Ihren Computer.

2. Laden Sie Ihre Artikel auf Ihre Website hoch.

3. Richten Sie eine robots.txt-Datei ein, um zu verhindern, dass Suchmaschinen Ihre Dateien sehen.

Ich behaupte nicht, dass dies das ist Beste Weg, um ein solches Archiv zu erstellen; Es ist einfach so, wie ich es gewählt habe.


Hier sind die Schritte, die ein Autor unternehmen könnte, um ein ähnliches Online-Archiv wie ich zu erstellen.

* Beachten Sie, dass Sie nur Dateien auf eine Website hochladen können, die Sie besitzen. Wenn Sie beispielsweise eine kostenlose wordpress.com-Site haben, können Sie keine Dateien hochladen und diese Methode daher nicht verwenden.

1. Kopieren Sie Ihre Artikel-Webseiten auf Ihren Computer

Der erste Schritt besteht darin, eine Kopie jeder Ihrer Artikelwebseiten zusammen mit allen Dateien (wie Bilddateien) zu erhalten, die erforderlich sind, damit die Seite wie ursprünglich angezeigt wird. Für mich als Windows-Benutzer war dies ein sehr einfacher, wenn auch etwas zeitaufwändiger Prozess.

Alles, was Sie tun müssen, ist, die Webseite jedes Artikels in einem Browser zu öffnen und a Speichern als zu deinem Computer.

In Windows ist dies so einfach wie das Schlagen Strg-S. Daraufhin wird ein Fenster geöffnet, in dem Sie die Webseitendatei des Artikels sowie alle Zusatzdateien speichern können, die erforderlich sind, um das ursprüngliche Erscheinungsbild beizubehalten.

Speichern Ihrer Webseite in einem Ordner auf Ihrem Computer

Beginnen Sie mit der Auswahl oder Erstellung eines Ordners auf Ihrem Computer, um die heruntergeladenen Dateien zu erhalten. Öffnen Sie nun für jede Artikeldatei diese in Ihrem Browser und speichern Sie sie mit Strg-S in dem von Ihnen ausgewählten Ordner.


Beim Speichern unter werden zwei Entitäten in Ihrem Download-Ordner abgelegt. Die erste ist die Datei, die im Feld Dateiname benannt ist. Der zweite ist ein Ordner, der alle Dateien enthält, die erforderlich sind, damit die Seite das Erscheinungsbild beibehält, das sie online hatte.

So sah das Feld Speichern unter aus, als ich auf Strg-S geklickt habe, um einen Artikel mit dem Namen zu speichern Pennsylvanias "Wohlwollende Geste" Bill macht Sinn in meinen Yahoo-Ordner.

Sowohl die Webseitendatei als auch der Ordner mit den Zusatzdateien erhalten denselben Namen, mit der Ausnahme, dass dem Ordner am Ende des Namens "_folder" hinzugefügt wurde. Dieser gebräuchliche Name verbindet die beiden miteinander.

Wichtige Tipps zu Dateinamen

Der Name, mit dem Sie Ihre Webseite herunterladen, ist von nun an der Name. Dies liegt daran, dass beim Umbenennen der Webseitendatei oder des zugehörigen Ordners die Verknüpfung zwischen diesen Dateien unterbrochen wird. Dies geschieht auch dann, wenn Sie sie in denselben Namen umbenennen. Die einzige genehmigte Möglichkeit, eine heruntergeladene Webseite umzubenennen, besteht darin, sie in Ihrem Browser zu öffnen und erneut unter dem neuen Namen zu speichern. Stellen Sie daher sicher, dass Sie Ihren gewünschten Namen in das Feld Dateiname eingeben, bevor Sie die Seite speichern.

Ich hätte den Namen dieser Datei aus mehreren Gründen ändern müssen, bevor ich sie speichere.

Zuallererst enthält der Name, den die YCN-Website automatisch vergeben hat, viel zusätzliches Gepäck, das ich nicht benötigt habe (der Teil mit der Aufschrift "-Yahoo Voices - Voices.yahoo.com"). Alles, was ich für den heruntergeladenen Dateinamen wirklich wollte, war allein der Titel des Artikels.

Achten Sie im Dateinamen auf „Sonderzeichen“

Der zweite Grund, warum ich einen anderen Namen wählen musste, ist, dass der Artikelname einige nicht standardmäßige Zeichen enthält. Obwohl sie auf meinem Windows-Computer kein Problem verursachen, verhinderten diese nicht standardmäßigen Zeichen, dass die Verknüpfung zwischen den beiden erkannt wurde, als die Artikelwebseite und der zugehörige Ordner auf meine Website hochgeladen wurden. Das Ergebnis war, dass, obwohl ich den gesamten geschriebenen Inhalt meiner Seite sehen konnte, alle Formatierungen sowie die darin enthaltenen Bilder verloren gingen.

So sah die Originalseite auf der YCN-Website aus:

Aufgrund der Interferenz, die durch die nicht standardmäßigen Zeichen im Namen verursacht wird, wurde diese auf meiner Website folgendermaßen angezeigt:

Hier sind die nicht standardmäßigen Zeichen, die Sie in Schwierigkeiten bringen können

Was waren diese nicht standardmäßigen Zeichen, die meine wunderschön formatierte Seite durcheinander gebracht haben? Hier sind die, die ich gefunden habe: ; : ‘ ’ “ ” –

Dies sind die „intelligenten“ Versionen von doppelten Anführungszeichen, einfachen Anführungszeichen und Bindestrichen, die von einem Dokumenteditor wie Microsoft Word erstellt werden können, sowie Doppelpunkte und Semikolons. Wenn mein Website-Server eines dieser Zeichen in einem Datei- oder Ordnernamen sieht, weiß er nicht, was er damit tun soll. So sah der Name der hochgeladenen Datei im Dateimanager meiner Website aus:

Pennsylvanias "Wohlwollende Geste" Bill macht Sinn - Yahoo Voices - Voices.yahoo.com.html

Die einfache Lösung besteht darin, solche Zeichen entweder vollständig aus dem Dateinamen zu entfernen oder alle „intelligenten“ Zeichen durch ihre einfachen Entsprechungen zu ersetzen. Mit anderen Worten, wenn ich ein intelligentes Zitat auswähle ( ) in das Feld Dateiname eingeben und mit demselben Zeichen auf der Tastatur darüber tippen, ( ) wird ( ) und das Problem ist beseitigt.

Räume loswerden!

Eine letzte Sache, die ich jetzt beim Umbenennen meiner heruntergeladenen Webseite tun würde, ist, alle Leerzeichen im Namen durch Bindestriche oder Unterstriche zu ersetzen. "Bill Makes Sense" würde also zu "Bill-Makes-Sense" oder "Bill_Makes_Sense". Der Grund dafür ist rein ästhetisch. Ihr Website-Server ändert automatisch jeden Speicherplatz in einem Dateinamen in% 20. (% 20 ist der ASCII-Code für das Leerzeichen). "Bill macht Sinn" würde also als "Bill% 20Makes% 20Sense" angesehen werden. Ich möchte lieber die Striche sehen.

Sobald Sie Ihre Artikelwebseiten unter den gewünschten Namen auf Ihren Computer heruntergeladen haben, müssen Sie sie im nächsten Schritt auf Ihre Website hochladen.

2. Laden Sie Ihre Artikel auf Ihre Website hoch

Sie müssen sowohl die Artikeldatei als auch den zugehörigen Ordner in denselben Ordner auf Ihrer Website hochladen. In der Regel erstellen Sie diesen Ordner über das Dateimanager-Dashboard Ihrer Site als Unterordner Ihres Ordners public_html.

Der einfachste Weg, Dateien hochzuladen, ist die Verwendung eines Programms, das als FTP-Client bezeichnet wird. Dies ist einfach eine Anwendung, die Sie auf Ihrem Computer ausführen und mit der Sie Dateien in großen Mengen in den ausgewählten Ordner auf Ihrer Website hochladen können.

Der von meinem Webhosting-Dienst empfohlene FTP-Client ist FileZilla. Diesen habe ich verwendet. Weitere Informationen zu diesem kostenlosen Open Source-Programm erhalten Sie unter https://filezilla-project.org/.

Bei der Suche nach FTP-Clients bin ich auf eine interessante Alternative gestoßen, die Sie vielleicht ausprobieren möchten. Es heißt FireFTP und ist wie FileZilla kostenlos. Wie der Name schon sagt, handelt es sich um ein Add-On zum Firefox-Browser. Sobald Sie FireFTP installiert haben, wird es im Tool-Menü des Browsers angezeigt. Sie müssen nur darauf klicken, und ein einfaches, benutzerfreundliches Fenster wird geöffnet, in dem Sie Ihre Dateien schnell und einfach hochladen können.

Sie können weitere Informationen zu FireFTP auf cnet.com anzeigen und auf Wunsch herunterladen.

Video-Tutorial: So kopieren Sie Websites

3. Richten Sie Ihre robots.txt-Datei so ein, dass Suchmaschinen Ihre Dateien nicht sehen können

Suchmaschinen verwenden Web-Crawler-Roboter, um jede Datei zu identifizieren, auf die über das Internet zugegriffen werden kann. Es ist jedoch vorgesehen, dass Personen, die nicht möchten, dass diese Roboter ihre Dateien sehen, sich abmelden. Es wird als robots.txt-Datei bezeichnet.

Die robots.txt-Datei, die sich im obersten Verzeichnis Ihrer Website befindet, enthält spezifische Anweisungen für jeden Webcrawler, welche Ordner oder Dateien auf Ihrer Website ignoriert werden sollen.

Unter dem folgenden Link finden Sie detaillierte Anweisungen zum Einrichten einer robots.txt-Datei.

So erhalten Sie ein Inhaltsverzeichnis für Ihre hochgeladenen Dateien

Hier ist ein letzter Tipp, den ich sehr nützlich fand. Wenn Sie den Namen Ihres Archivordners (ohne Dateinamen) in Ihren Browser eingeben, werden die in diesem Ordner enthaltenen Dateien aufgelistet. Wenn Ihr Archivordner beispielsweise gehostet wird unter:

http://mywebsite.org/myArchive/

Wenn Sie dies in Ihren Browser eingeben, wird eine Seite erstellt, die ungefähr so ​​aussieht:

Index von / myArchive

  • übergeordnetes Verzeichnis
  • Mein erster Artikel.html
  • My-First-Article_files /
  • Mein zweiter Artikel.html
  • My- Second -Article_files / ... und so weiter.

Sie können jeden Artikel öffnen, indem Sie einfach auf den Link auf der Indexseite klicken.

Außerdem fand ich es praktisch, den Index in ein Microsoft Word-Dokument zu kopieren (Strg-A gefolgt von Strg-C im Browser und dann Strg-V, um die Liste in Word einzufügen. Löschen Sie dann die Zeilen, die mit "_files /" enden. ). Auf diese Weise kann ich dieses Word-Dokument als Inhaltsverzeichnis verwenden und auf alle meine Artikeldateien zugreifen, indem ich einfach die Strg-Taste gedrückt halte, während ich auf den Link klicke.

Meine Dateien sehen so aus, wie sie sollten

Meine hochgeladenen Dateien erscheinen auf meiner Website fast genau in ihrer ursprünglichen Form, einschließlich der Kommentare und der meisten Anzeigen.

Wenn Sie den Artikel sehen möchten, den ich als Beispiel für den Prozess verwendet habe, können Sie darauf zugreifen, indem Sie hier klicken.

Es gibt zwar schnellere und einfachere Möglichkeiten, das zu tun, was ich hier getan habe, aber für jemanden, der nur daran interessiert ist, seine Artikel genau so zu erhalten, wie sie ursprünglich ausgesehen haben, funktioniert dies für mich.

Ich hoffe es funktioniert auch für dich.

Dieser Artikel ist genau und nach bestem Wissen des Autors. Der Inhalt dient nur zu Informations- oder Unterhaltungszwecken und ersetzt nicht die persönliche Beratung oder professionelle Beratung in geschäftlichen, finanziellen, rechtlichen oder technischen Angelegenheiten.

Suchen

Achten Sie Sicher

Z-Edge F1 Doppelobjektiv-Autokamera-Test: Feinste automatische Überwachungskamera
Computers

Z-Edge F1 Doppelobjektiv-Autokamera-Test: Feinste automatische Überwachungskamera

Krzy ztof i t ein leben langer zukünftiger Tech-Junkie, der die neue ten Ge chichten von Unternehmen wie Apple, am ung, Google und Amazon unter ucht.Die Z-Edge F1 Da h Cam i t eine hochauflö...
EU-Vorschriften und Website-Design für ein neues World Wide Web
Internet

EU-Vorschriften und Website-Design für ein neues World Wide Web

Tamara Wilhite i t techni che Redakteurin, Wirt chaft ingenieurin, Mutter von zwei Kindern und veröffentlichte cience-Fiction- und Horror-Autorin.Die EU hat eine Reihe von Vor chriften zum Guten ...