Indexing • Dominik's Blog https://dominikkleidt.de Ein IT Blog für alle Mon, 06 Nov 2023 18:08:09 +0000 de hourly 1 https://wordpress.org/?v=6.6.2 Navigate the Web: Unlocking Privacy with Search Engines, Data Security, and SEO Insights https://dominikkleidt.de/2023/11/15/navigate-the-web-unlocking-privacy-with-search-engines-data-security-and-seo-insights/ https://dominikkleidt.de/2023/11/15/navigate-the-web-unlocking-privacy-with-search-engines-data-security-and-seo-insights/#comments Wed, 15 Nov 2023 11:00:00 +0000 https://dominikkleidt.de/?p=316 Warum dieser Beitrag?/Vorwort/Ziel Ich glaube daran, dass Suchmaschinen (eng. Search Engines) ein fester Bestandteil des Lebens sind. Suchmaschinen sind ein Quell von Wissen, Möglichkeiten Neues zu entdecken oder auch einen guten Deal zu finden. Doch Suchmaschinen können auch Schattenseiten haben,... Weiterlesen →

The post Navigate the Web: Unlocking Privacy with Search Engines, Data Security, and SEO Insights first appeared on Dominik's Blog.

]]>
Warum dieser Beitrag?/Vorwort/Ziel

Ich glaube daran, dass Suchmaschinen (eng. Search Engines) ein fester Bestandteil des Lebens sind.

Suchmaschinen sind ein Quell von Wissen, Möglichkeiten Neues zu entdecken oder auch einen guten Deal zu finden.

Doch Suchmaschinen können auch Schattenseiten haben, in dem diese einen tracken und somit die Privatspähere ihrer Nutzer ignorieren.

Das Ziel dieses Beitrages ist es, vereinfacht, aufzuklären was Suchmaschinen sind.

Wie diese funktionieren und weshalb es wichtig ist, das du dir bewusst bist wie ein „Profil“ von dir angelegt wird für z.B. Werbung.

Auch gehen wir nicht auf jedes technische Feature ein wie z.B. TOR/onion Dienste.

Eckdaten/Bereiche

Bevor wir ins Detail gehen, möchte ich dir eine Übersicht geben welche Themen/Bereiche wir hier beleuchten werden.
Dabei wird darauf eingegangen, wieso die „normalen“ Varianten eher zu deinem Nachteil sind und weshalb diese kleine Änderung mit einer Alternative viel bringen kann.

  • Der Anfang (Basis)
  • Internet Browser
  • Suchmaschinen ←Hier befinden wir uns in diesem Beitrag
  • Alternative Frontends für deine Lieblingsplattformen
  • Android Betriebssysteme
  • Linux Betriebssysteme
  • Windows Einstellungen für mehr Privatsphäre
  • Aussicht auf weitere Themen

Was sind Suchmaschinen überhaupt

Vorab, hier wird das Ganze vereinfacht dargestellt, da es viele Unterthemen hierzu geben kann.

Suchmaschinen kann man wie einen Bibliothekar für das Internet sehen.

Sie indexieren die verfügbaren Internetseiten und passen ihre Suchergebnisse mit einem Algorithmus deiner Anfrage an.

Bedeutet also, du gehst zu deiner Suchmaschine nach Wahl und gibst ein, wonach du suchst, oder was du wissen willst.

Die Suchmaschine baut anhand deiner Eingabe einen Index auf, welcher mit dem Algorithmus gefiltert wird.

Ähnlich also zu einem Bibliothekar, welchem du sagen kannst was du suchst und dieser dir weitere Fragen stellt um die Suche auf dich anzupassen.

Das „Nachfragen“ vom Bibliothekar nimmt einem in diesem Fall der Algorithmus ab.

Um nun zu funktionieren, werden mehrere Teilschritte durchlaufen.

Die Wichtigsten sind die Folgenden:

CrawlingIndexingRanking

Das Internet wird nach Inhalten durchsucht, wobei der Code/Inhalt jeder gefundenen URL überprüft wird.

Speichern und Organisieren der während des Crawling-Prozesses gefundenen Inhalte. Sobald sich eine Seite im Index befindet, wird sie bei relevanten Suchanfragen als Ergebnis angezeigt.

Bereitstellung der Inhalte, die die Suchanfrage eines Nutzers am besten beantworten, d. h. die Ergebnisse werden nach der höchsten bis zur geringsten Relevanz geordnet.

Big Tech Suchmaschinen sind keine Freunde

Auch wenn die Big Tech Suchmaschinen mit vielen Features locken „um eine schöne Erfahrung“ zu machen, sind grade diese es, die viel mehr von dir wollen.

Es werden Daten gesammelt, denn Daten sind Macht in unserer Zeit.

Sei es die Integration von KI in der eigenen Suchmaschine oder die Integration von einem Geräte übergreifenden Konto, dass dir alles synchronisiert, you name it.

Alles nette Features, doch es werden dabei IMMER Daten über einen gesammelt, selbst wenn man die Cookies ablehnt, werden weiterhin so viele Daten wie legal möglich einverleibt.

Beiden diesen Daten kann es sich unter anderem um folgende Daten handeln:

  • Aufzeichnungen
  • Suchverlauf
  • persönliche Daten
  • Browsering/Surfing Verhalten
  • Wie du auf die Suchmaschine gekommen bist
  • Standort
  • IP-Adresse
  • Weitergabe der Aufzeichnungen an Dritte
  • zur weiter Verarbeitung
  • weil deine Daten verkauft wurden
  • Tracking
  • Anhand der Aufzeichnungen wird dein Standort mit einem 10 Kilometer Umkreis genau angegeben
  • Profilbildung Anhand deines Verhaltens, sei es beim Surfen, suchen etc.
  • Durch die Profilbildung wird eine „personalisierte“ Erfahrung versprochen, doch es geht viel mehr darum die eindeutig identifizierbar im Internet zu machen.

Allgemeines zu Alternativen

Die Alternativen die du gleich sehen wirst, haben vorab eine Sache gemeinsam:

Sie möchten eine Privatsphäre-schützende Suchmaschine sein.

Bedeutet, dass alle genannten Anbieter dein Recht auf Privacy respektieren und Maßnahmen ergriffen haben, um diese zu schützen.

Dabei werden die oben genannten Daten entweder gar nicht oder nur für technisch relevante Zwecke genutzt.

Mit technisch relevant meine ich, dass deine IP-Adresse nötig ist, damit du die Seite nutzen und auch Suchergebnis erhalten kannst.

Jedoch wird kein Tracking betrieben.

Dadurch resultiert, dass auch deine Daten nicht verkauft werden, da diese auch nicht gesammelt werden.

Das mag ja alles schön sein, doch da es sich hier IMMER um private Anbieter/Unternehmen handelt, ist die Frage offen wie machen diese Suchmaschinen Geld?

Nun es gibt mehrere Möglichkeiten.

Die wohl beliebteste und häufigste verbreite ist die „Privatspähere respektierende“ (engl. Privacy respecting) Werbung.

Damit ist gemeint, dass du Werbung in Form von Links erhältst, für die der jeweilige Anbieter eine Leistung erhält. Dabei wird jedoch nicht auf das Klickverhalten oder auf mögliche Profildaten zurückgriffen. Sondern es zählt lediglich, dass jemand auf den Link geklickt hat oder es wird die Anzahl der bereitgestellten Anzeigen hergezogen.

Dabei werden keine Daten übertragen wie „Wo du vorher warst?“.

Auch die Art der Werbung ist neutral, bedeutet du erhälst Werbung basierend auf deine Suche.


Beispiel

Du suchst nach einem Auto, dann erhältst du Werbung zu Autos.

Anderes Beispiel: Du suchst Bücher, dann wird dir Werbung zu Büchern angezeigt.

Eine weitere Möglichkeit der Finanzierung ist „kostenpflichtige“ Dienste anzubieten und diese zu Bewerben um einen Teil zu finanzieren. Hier kann es sein, dass ein VPN Dienst der Hauptfokus des Herstellers ist und die Suchmaschine „nur“ ein Nebenprodukt.

Auch die Möglichkeit über das Einwerfen von Geld eine „Premium“ Variante zu nutzen, ist möglich.

Dabei wird dann gar keine Werbung angezeigt, jedoch finanziert man das Projekt direkt.

Affiliate Programme sind ebenfalls möglich für einen Finanzierung.

Spenden werden von den meisten Anbietern ebenfalls angenommen.

Du siehst schon „Werbung“ fällt hier recht oft, dass liegt daran, wenn Dienste kostenlos angeboten werden, die Anbieter das Geld auf andere Wege wieder erwirtschaften müssen.

Daher gibt es auch „Debatten“ über das Thema Adblocker.

Zum Thema Adblocker wird noch ein eigener Blogbeitrag erstellt, ausgelöst durch die YouTube Anti-Adblocker Maßnahmen.

In diesem Beitrag werden „nur“ kostenlose Alternativen betrachtet.

Bedeutet, Anbieter die eine Search Engine hinter einem bezahlten Dienst anbieten, fallen hier raus.

Das soll jedoch nicht heißen, dass diese Anbieter schlecht sind.

DuckDuckGo

Diese Search Engine hast du bestimmt bereits mal gesehen.

Die Suchmaschine mit der Ente als Logo, ist am September 2008 in der USA gestartet und seitdem eine Konstante im Internet.

Wie vorher oben erwähnt, finanziert sich DuckDuckGo (kurz. DDG) über Werbung und Spenden.

Dabei greift die Suchmaschine auf das „Microsoft Adversiting“ Netzwerk zu.

Dieses Netzwerk wird, wie der Name bereits verrät, von Microsoft betrieben und bietet Werbung unter anderem auf Bing (Microsofts eigener Suchmaschine) und Yahoo Search an.

Dabei wird seitens DuckDuckGo betont, dass die Werbung aus dem Netzwerk keine Tracker beinhaltet und es auf die Vereinbarung mit dem Werbetreibenden ankommt.

Ebenfalls hat DDG einen „Affiliate“ Status mit Ebay, und Amazon, wodurch alle Links die über DuckDuckGo zu Ebay oder Amazon führen eine Beteiligung mit sich ziehen.

Dabei wird auch hier betont, dass es eine „Vereinbarung“ gibt, durch welche das Tracking und Sammeln von Daten ausgeschlossen ist.

Die Suchergebnisse bzw. die Webseiten werden teilweise selbst und durch Indexierungen von Yahoo, Yandex und Bing möglich.

Auch bietet DDG ein paar Feautres an wie z.B. !BANGS, damit sind Kürzel gemeint die bei DuckDuckGo vor der Suche eingegeben werden können um direkt das Suchergebnis auf der Wunschplattform zu erhalten.

Beispiel !BANG: !yt IT-Security

!yt steht in dem Fall für YouTube und als Suchbegriff übergeben wir IT-Security.

Als nächstes wird über DDG eine Anfrage mit diesem Suchbegriff an YouTube geschickt und wir befinden und direkt auf der Video Plattform mit unser Wunschsuche.

Liste aller bangs

https://duckduckgo.com/bangs

Startpage

Startpage ist in den Niederlanden entwickelt worden und ist somit auch Teil der EU.

Bedeutet alleine die DSGVO (Datenschutzgrundverordnung) ist eine Voraussetzung.

Doch das ist nicht alles, denn Startpage bietet sogar ein „Proxy“ Feature an, wodurch eure Suchen gar nicht auf dem Papier auftauchen, da Startpage für euch die Suche abgibt.

Ein weiterer Vorteil von Startpage ist, dass hier keine eigenen oder Indexierung von anderen Suchmaschinen genutzt werden….außer von Google!

Denn wir wissen alle, Google hat die besten Ergebnisse.

Daher geht Startpage her und übernimmt die Indexierung von Google für die Suche, dabei werden eure Daten etc. natürlich nicht weitergeben.

Ebenfalls wird das Tracking unterbunden, sowohl bei der Standardsuche als auch beim Proxy.

Wie das genau passiert ist nicht einsehbar, was auch Sinn macht, da sonst jemand diesen Mechanismus aushebeln könnte.

Hinzu kommt, dass Edward Snowden Startpage als Alternative empfiehlt, da Startpage keine Daten speichert oder weiter verarbeitet.

Snowden ist, sofern nicht bekannt, DIE Koryphäe wenn es um Privatspähere und Anonymität geht.

https://www.startpage.com/?t=light

QWANT

QWANT kommt ebenfalls aus der EU, nämlich Frankreich.

Was QWANT jedoch besonders macht sind zwei Aspekte.

Zum Einen ist diese Suchmaschine in Frankreich so weit verankert, das die gesamte französische Regierung diese Search Engine verwenden und dies auch aktiv sollen.

Dass Andere ist, dass zusammen mit dem französischen Bildungsinstitut eine „Kinderfreundliche“ Variante erschaffen wurde mit QWANTJunior : https://www.qwantjunior.com/

Diese Version von QWANT soll ermöglichen, dass Kinder ohne Ablenkungen und ohne Werbung eine Suchmaschine verwenden können.

Finanziert wird offiziell nur um Kosten zu decken für Hosting. (Domain, Server, Traffic etc.)

Ob dem so ist, kann ich nicht verifizieren.

Dabei wird ähnlich wie bei anderen Bewerbern, auf Werbung gesetzt die dich nicht trackt und auf deine Suchanfrage bezogen ist.

Indexiert wird von QWANT sowohl selbst als auch wird die Bing Indexierung herrangezogen.

https://about.qwant.com/de/

https://about.qwant.com/de//search/

SearXNG

SearXNG ist sehr interessant, da diese Suchmaschine nicht nur im Internet nutzbar ist, sondern jeder kann seine eigene Instanz davon betreiben.

Ebenfalls ist SearXNG open-source heißt jeder kann den Quellcode anschauen und sowohl Verbesserung beitragen, als auch feststellen ob doch Tracker eingebaut sind.

Nach aktuellem Stand (25.10.2023) sind keine Tracker/Profil Bildungen möglich.

Um diese Search Engine selbst zu betreiben, empfehle ich das GitHub Repository zu konsultieren, denn hier werden alle möglichen Installation unter „Setup“ verlinkt und erklärt.

Das Projekt selbst wird durch Spenden finanziert und es steht jedem frei seine eigene Instanz für sich selbst oder public zu installieren.

Volle Kontrolle für jeden.

https://github.com/searxng/searxng

https://searx.space/

https://docs.searxng.org/

Fazit

Suchmaschinen müssen keine Profile von dir erstellen oder dich tracken um gute Suchergebnisse zu liefern.

Auch kann man sich durch andere Wege finanzieren, wie es die oben genannten Search Engines vormachen.

Das ist gut, denn somit kann man, ohne alle Daten hergeben zu müssen, Suchmaschinen verwenden.

Genauso lernt man auch durch die anderen Maschinen, seine Suchanfragen besser zu formulieren.

Was bedeutet, dass die erste Schnittstelle zum Thema SEO (Search Engine Optimazation) vorhanden ist, wenn auch nur aus der Benutzersicht.

Ich hoffe, dass du nun eine der genannten Suchmaschinen verwendest oder vielleicht sogar eine andere, die mir nicht bekannt ist.

Lass es mich gerne in den Kommentaren wissen um an deinem Wissen teilzuhaben.

The post Navigate the Web: Unlocking Privacy with Search Engines, Data Security, and SEO Insights first appeared on Dominik's Blog.

]]>
https://dominikkleidt.de/2023/11/15/navigate-the-web-unlocking-privacy-with-search-engines-data-security-and-seo-insights/feed/ 3