Ende von Google Site Search: Alternative Suchtechnologien für die Website

22. Februar 2017
1931 Views
Comments are off for this post

Mit der Ankündigung von Google, seinen beliebten Dienst für integrierbare Webseiten-Suchfunktionen Google Site Search (GSS) im Laufe des Jahres einzustellen, beginnt für viele Betreiber von umfangreichen Webangeboten die Suche nach einer neuen Suchtechnologie. Von der werbefinanzierten Google Custom Search (GCS) aus dem Hause Google über verschiedene cloud-basierte Lösungen bis hin zum Betrieb einer eigenen Suchtechnologie reichen die Alternativen, die wir in diesem Beitrag vorstellen.

Google Custom Search

Ebenfalls aus dem Hause Google, allerdings werbefinanziert mit reduziertem Funktion- und Leistungsangebot kommt die Google Custom Search daher. Im Vergleich zur kostenpflichtigen Variante bietet diese keine Möglichkeit mehr, Werbeanzeigen auszublenden oder das Google Branding zu entfernen. Auch stehen die Integrationsmöglichkeiten über die XML-API nicht mehr zur Verfügung. So können Suchen nur noch über eine JSON-API integriert werden, welche zudem über ein Tageslimit bei den Abrufen verfügt. Insgesamt konzentriert sich Google mit der GCS wohl eher auf nicht-kommerzielle und private Nutzer, beispielsweise von Blogs oder gemeinnützigen Webseiten, da auch der Support per E-Mail oder die komplexeren Administrationsmöglichkeiten entfallen.

Die Google Custom Search ist im kommerziellen Umfeld wohl keine Alternative, da vermutlich die wenigsten Unternehmen Werbung in ihren eigenen Suchergebnissen eingebunden haben möchten und die Integrationsmöglichkeiten deutlich eingeschränkt sind.

CLUDO

Aus Dänemark kommt mit CLUDO eine Alternative, die sich auf der eigenen Webseite bereits als Alternative zur GSS positioniert. Der Leistungs- und Funktionsumfang von CLUDO ist mit der Google Site Search vergleichbar: Synonyme können gepflegt, die Autokorrektur bei der Eingabe der Suchbegriffe genutzt und Suchergebnisse hervorgehoben werden. Dank API können URLs direkt an CLUDO übermittelt werden, alternativ kann ein JavaScript-Code in die Seite eingebunden werden, der dem CLUDO-Spider mitteilt, welche Seiten indiziert werden sollen. Weitere Vorteile gegenüber Google Site Search sind die Möglichkeiten der Personalisierung von Suchergebnissen, die manuelle Manipulation von Suchergebnissen oder ganzen Bereichen (URL-Segementen) sowie das Hinterlegen von Quicklinks, was der „I’m feeling lucky“ Funktion bei Google entspricht.

Der Anbieter CLUDO ist im Vergleich zu Google sehr klein: Gerade einmal 12 Mitarbeiter werden auf der Webseite aufgeführt, dafür verfügt CLUDO über Büros in London, Kopenhagen und Minneapolis. Informationen zu Preisen oder Lizenzkosten sind auf der Webseite nicht auf dieser Übersicht zu finden, eine kostenlose Demo kann eingerichtet werden.

Algolia

Aus Frankreich kommt mit Algolia eine innovative und mittlerweile etablierte Cloud-Lösung für die Webseiten-Suche. Im Angebot gibt es neben der kostenfreien Variante mehrstufige professionelle Versionen sowie eine Enterprise-Lösung, wobei sich letztere preislich zwischen 49 und 4.000 US$ / Monat bewegt. Algolia bietet zahlreiche APIs und Integrationsmöglichkeiten, die Out-of-the-Box zur Verfügung stehen: Von Plugins für WordPress oder Magento bis hin zu SDKs für PHP, Java, C# und weitere Programmiersprachen sind die Integrationsszenarien für Algolia vielfältig. Allerdings ist Algolia keine klassische Websuche, die über einen Spider einen eigenen Index aufbaut: stattdessen muss dieser durch den Betreiber der Suche angelegt und befüllt werden. Die Integrationsbeispiele – unter anderem für umfangreiche Dokumentationen – zeigen aber, dass Algolia auch als Volltextsuche genutzt werden kann.

Algolia zeichnet sich vor allem durch eine hochverfügbare Plattform-Architektur aus. Das genutzte CDN von Algolia erlaubt es, den Suchindex auf weltweite Server zu verteilen und damit hochperformant verfügbar zu machen. Die Performance der Suchfunktion überzeugt auch im Rahmen erster von uns durchgeführter Tests mit komplexeren und größeren Datenvolumen.

Das Unternehmen hinter Algolia wurde 2012 gegründet und besteht mittlerweile aus über 60 Mitarbeitern mit Sitz in Paris und San Francisco. Namhafte Investoren haben in das Start-Up investiert und Kunden wie LVMH, Quicksilver, Periscope, Fotolia und Product Hunt nutzen die Technologie bereits erfolgreich für E-Commerce- und Content-Plattformen.

Amazon CloudSearch

Auch Amazon bietet eine cloud-basierte Suchtechnologie, die auf Basis der Amazon-Infrastruktur betrieben und bereitgestellt wird. Die Plattform ist – wie alle Amazon-Lösungen – auf extreme Skalierbarkeit ausgelegt und wird entsprechend in Rechnung gestellt: Die Abrechnung erfolgt auf Basis der Stunden, in denen die Suchtechnologie genutzt wird. Sie kann über mehrere Rechenzentren hinweg verteilt werden.

Funktional kann die Amazon CloudSearch mit den Diensten von Google problemlos mithalten: Freitextsuche, Auto-Vervollständigung, frei definierbare Relevanzsortierung und Bewertung der Datenfelder sowie die Unterstützung von 34 Sprachen bilden die Grundlage für umfassende Web-Suchfunktionen. Aus technischer Sicht ist die Implementierung auf Basis verschiedener SDKs (ava, Ruby, Python, .NET, PHP und Node.js) möglich. Die Daten können per API oder Spider erfasst und indiziert werden. Die Grundlage der Suchtechonologie von Amazon bildet die Open-Source-Suchmaschine Apache Solr, die durch Amazon um zahlreiche Funktionen ergänzt wurde.

Apache Solr

Die Open-Source-Technologie von Apache bildet als Framework die Grundlage für zahlreiche Suchmaschinen. Im Vergleich zu den oben genannten Suchtechnologien wird Solr allerdings als eigener Dienst auf dem Kunden-Server installiert und betrieben. Solr erlaubt die Indizierung von Webseiten und Datenbankinhalten auf Basis von Lucene, einer Indizierungstechnologie, ebenfalls Open-Source und aus dem Hause Apache. Die Integration von Solr erfolgt jeweils individuell auf Basis des entsprechenden Kundenprojektes und muss mit der entsprechenden CMS- oder Shop-Technologie verknüpft bzw. an die jeweiligen Datenquellen angebunden werden.

Weitere Alternativen

Neben den genannten Technologien und Systemen sind auf dem Markt noch zahlreiche weitere Suchtechnologien und spezialisierte Lösungen verfügbar, beispielsweise FACT-Finder für E-Commerce-Plattformen oder Elastic als Suchtechnologie. Wenn Sie Fragen zu einer passenden Alternative zu Ihrer Google Site Search haben, kommen Sie gerne auf uns zu.

Ihr Ansprechpartner:
Matthias Steinforth
Geschäftsführung
Telefon: 0221 – 569 576-202
E-Mail: m.steinforth@kernpunkt.de