SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Veröffentlicht von Patricia Kaufmann Ho ho ho, meine suchenden Freunde! Na, habt ihr eure Weihnachtswünsche schon abgeschickt? Wieso ich so kurz vor Weihnachten Zeit habe, mit euch zu plaudern, wollt ihr wissen? Ganz einfach – dieses Solr, das wir letztes Jahr entdeckt haben, nimmt mir so viel Arbeit ab, dass ich jetzt auch mal Zeit habe, die Vorweihnachtszeit zu genießen. Diese Weihnachtsmärkte, ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Veröffentlicht am 26.10.2017 von Patricia Kaufmann Die SolrCloud bietet eine Reihe von Mechanismen, um die Ausfallsicherheit des Clusters zu erhöhen. Dazu gehört zum einen die Verteilung der indexierten Daten auf mehrere Solr-Knoten und zum anderen das Management des Clusters durch ZooKeeper. Vor Allem aber die Möglichkeit, Indexe auf andere Knoten zu replizieren, schützt vor Fehlern und Nicht-Er...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Graph your Stream Veröffentlicht am 17.10.2017 von Patricia Kaufmann Sie sehen sich vor einem Berg kryptisch formulierter Log-Daten stehen, aus denen Informationen nur schwer zu extrahieren sind? Sie haben eine Idee zur Optimierung Ihrer Systeme, aber wissen nicht, wie Sie diese verifizieren und präsentieren können? Oder wollen Sie einfach mal herausfinden, welche Features Sie in Ihren Online-Shop...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

Eclipse Docker

  • Veröffentlicht am 10.10.2017 von Stefan Langenmaier Eclipse ist als IDE für Java bekannt und bewährt. Eclipse versteht sich selbst aber als wesentlich mehr. Diese Serie soll Eclipse als Entwicklungsumgebung vorstellen, die als Hilfswerkzeug dient, um schnell Experimente durchzuführen. Es wird sich dabei herausstellen, dass Eclipse hauptsächlich als vereinigendes Element verschiedener anderer Techn...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Testing your Needs – The Apache Nifi Test Framework 07.09.2017 by Johannes Brucher In this last part of our Nifi blog series, we will have a deeper look into Nifi’s test framework. To demonstrate the key concepts, we will write some JUnit tests for our custom LogCustomMessage processor that we implemented in the second part. First things First – Integration of Nifi’s Test Framework To make use of ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Recycle your Garbage Veröffentlicht am 28.08.2017 von Patricia Kaufmann Sie sehen sich vor einem Berg kryptisch formulierter Log-Daten stehen, aus denen Informationen nur schwer zu extrahieren sind? Sie haben eine Idee zur Optimierung Ihrer Systeme, aber wissen nicht, wie Sie diese verifizieren und präsentieren können? Oder wollen Sie einfach mal herausfinden, welche Features Sie in Ihren Online-S...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

Eclipse Zookeeper

  • Veröffentlicht am 24.08.2017 von Stefan Langenmaier Eclipse ist als IDE für Java bekannt und bewährt. Eclipse versteht sich selbst aber als wesentlich mehr. Diese Serie soll Eclipse als Entwicklungsumgebung vorstellen, die als Hilfswerkzeug dient, um schnell Experimente durchzuführen. Es wird sich dabei herausstellen, dass Eclipse als vereinigendes Element verschiedener anderer Technologien zu seh...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Veröffentlicht am 16.08.2017 von Daniel Wrigley Die ersten beiden Teile dieser Serie drehten sich darum, welche Daten innerhalb eines Online-Shops gespeichert werden sollen und wie diese getracked werden können. In diesem dritten Teil geht es nun um die Nutzung dieser Daten, nachdem an dieser Stelle bereits bekannt ist, welche Daten sich lohnen zu speichern und wie dies umgesetzt werden kann. Für ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Browse around Veröffentlicht am 11.08.2017 von Patricia Kaufmann Sie sehen sich vor einem Berg kryptisch formulierter Log-Daten stehen, aus denen Informationen nur schwer zu extrahieren sind? Sie haben eine Idee zur Optimierung Ihrer Systeme, aber wissen nicht, wie Sie diese verifizieren und präsentieren können? Oder wollen Sie einfach mal herausfinden, welche Features Sie in Ihren Online-Shop ein...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

What is Nifi - Part 2

  • How Nifi fits into your needs; Part 2 04.08.2017 by Johannes Brucher In Part 1 of this series we had a look at the general concepts of Nifi and how Nifi can help moving your data a level higher. In Part 2 we will look at the extension points Nifi is providing, especially the most important one the ‘Processor Extension Point’.Nifi comes with ~ 225 default processors, but even with this high number ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Veröffentlicht von Daniel Wrigley am 25.07.2017 Nachdem im ersten Teil der Blog-Serie dargestellt wurde, dass das Tracken von User-Interaktionen innerhalb eines Online-Shops für unterschiedlichste Zwecke lohnenswert ist, geht es in diesem zweiten Teil darum, wie diese am besten mitgeschnitten und gespeichert werden können.

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Veröffentlicht am 21.07.2017 von Daniel Wrigley Mit der exponentiell steigenden Menge an unstrukturierten Daten wird deren Verarbeitung ein immer zentraleres Thema. Als Unternehmen, das sich täglich mit Suche in Daten beschäftigt, ist die Verarbeitung dieser Daten unter dem Gesichtspunkt optimaler Auffindbarkeit von immenser Bedeutung. Die Kerntechnologien, die als Suchmaschinen aus dem Open Sourc...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Jump into the Zeppelin Veröffnetlicht von Patricia Kaufmann am 17.07.2017 Sie sehen sich vor einem Berg kryptisch formulierter Log-Daten stehen, aus denen Informationen nur schwer zu extrahieren sind? Sie haben eine Idee zur Optimierung Ihrer Systeme, aber wissen nicht, wie Sie diese verifizieren und präsentieren können? Oder wollen Sie einfach mal herausfinden, welche Features Sie in Ihren Online...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

What is Nifi - Part 1

  • What is Nifi and how can it help moving up data a level higher - Part 1 Apache Nifi is a powerful system to process and distribute data across different systems. It enables the automation of data flows and can be seen as a data logistic platform.Data can be processed in real time, in batches and even an event can trigger certain tasks. Apache Nifi supports powerful and scalable directed graphs of ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Never Ending Story - Teil 1 Veröffentlicht am 05.07.2017 von Daniel Wrigley Jeder Betreiber eines Online-Shops weiß, dass es einer unendlichen Geschichte gleicht, diesen konstant verbessern und optimieren zu müssen, um den Anschluss an die Konkurrenz nicht zu verlieren und die User und Kunden bei Laune zu halten und nicht zu verlieren.Diese Blog-Serie soll zeigen, wie die Daten, die die User in On...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Grab a banana Veröffentlicht am 29.06.17 von Patricia KaufmannSie sehen sich vor einem Berg kryptisch formulierter Log-Daten stehen, aus denen Informationen nur schwer zu extrahieren sind? Sie haben eine Idee zur Optimierung Ihrer Systeme, aber wissen nicht, wie Sie diese verifizieren und präsentieren können? Oder wollen Sie einfach mal herausfinden, welche Features Sie in Ihren Online-Shop einbau...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Die sogenannten „Saved Searches“ sind eine Suchtechnik, bei der ein Anwender seine Suche „speichern“ kann. Jede Änderung im Index wird mit den Saved Searches abgeglichen. Sobald ein Produkt auf diese Suche passt, wird der Anwender (beispielsweise durch eine E-Mail) benachrichtigt. Dies ermöglicht ein nachträgliches Finden von Produkten, Artikeln etc. Diese Technik lohnt sich vor allem dann, wenn d...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Dass Suche mittlerweile mehr ist, als nur das Auffinden von Dokumenten, die ein Suchwort beinhalten, ist längst kein Geheimnis mehr. Ebenso ist hinlänglich bekannt, dass es hierfür Lösungen gibt, die sehr weit ausgereift sind. Dies sind nicht nur Lösungen kommerzieller Natur, sondern auch kostenlose Open Source Varianten, wie Apache Solr, die unübertroffene Skalierbarkeit zeigen.

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Bei Apache Solr gibt es grundlegend keine Sicherheitsmechanismen. Dies betrifft sowohl den Zugriff auf den Solr-Server selbst, als auch die einzelnen Dokumente. Natürlich gibt viele bewährte Workarounds hierfür. Beispielsweise kann man den Solr-Server im eigenen Netz so absichern, dass nur bestimmte Ports freigeschaltet werden. Für Dokumentsicherheit kann man ACL Informationen mit im Index abspeic...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Diese Woche ist Apache Solr 4.9 veröffentlicht worden. Neben vielen Bug-Fixes und Verbesserungen gab es auch einige neue Funktionalitäten. Eine von den hervorstechenden Neuerungen ist die AnalyticsQuery API, die ich in diesem Blog kurz vorstellen werde.

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Apache Solr 4.9 steht in den Startlöchern. Daher wird es Zeit neue und spannende Funktionalitäten unter die Lupe zu nehmen. Eine der kommenden Neuerungen wird das sogenannte Re-Ranking sein, welches ich in diesem Blog beschreiben möchte.

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Wie bereits im vergangenen Blog (Monitoring mit Solr) angedeutet, möchte ich hier nun auf die Möglichkeit eingehen, wie man Log-Dateien mittels Logstash verarbeiten kann, so dass diese anstelle in einem Elasticsearch Index in einem Solr Index landen. Logstash bietet eine Vielzahl von Plugins, sowohl für „input“, „filter“ oder „output“. Das Plugin für den Solr Output ist nicht integraler Bestandtei...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • In einem früheren Blog habe ich einen kurzen Einblick in Apache Stanbol und Named Entity Recognition (NER) gegeben. Die gezeigte Oberfläche war der Stanbol Enhancer. Er ist dafür zuständig, Entitäten im Fließtext zu erkennen. In diesem Beitrag will ich etwas näher auf den sogenannten Contenthub eingehen, der ebenfalls Teil von Apache Stanbol ist. Der Contenthub besteht aus zwei Komponenten: Store ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

Monitoring mit Solr

  • Monitoring ist ein wichtiges Thema. Egal ob es sich um die technische Überwachung einer Serverlandschaft handelt oder beispielsweise um das Tracking des Userverhaltens beim Einkauf in einem Onlineshop. Es ist immer wichtig, gezielt nach Informationen wie Conversion-Rate oder CPU-Auslastung zu „suchen“, diese aufzubereiten und darzustellen. Sehr schnell kommt man bei diesem Thema mit dem ELK-Stack ...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Mein Kollege Daniel Wrigley hatte vor gut einem Jahr bereits über das Document-Routing in Solr in einem Blogbeitrag berichtet. In diesem Jahr sind weitere Solr Versionen mit Anpassungen, Erweiterungen und neuen Features veröffentlicht worden. Die Änderungen betreffen auch das mit Solr 4.1 eingeführte Document Routing. Mit der Solr Version 4.5 wurde dieses Feature überarbeitet und vereinfacht. Dies...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post
  • Am 28. Januar wurde die Version 4.6.1 von Open Source Suchserver Apache Solr veröffentlicht. Es handelt sich hierbei um ein Release, das knapp 30 Bugs bereinigt. Das sorgt für mehr Stabilität und Verlässlichkeit. Mark Miller, Lucene PMC und Solr Committer nennt es deshalb sogar einen Meilenstein in der Entwicklung von SolrCloud, die Ende 2012 eingeführt wurde. Sie können die Veränderungen in diese...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

Der Hunspell Stemmer

  • In einem früheren Beitrag bin ich bereits etwas näher auf das Thema Stemming in der Analysekette von Solr (http://www.shi-gmbh.com/blog/solr-analysekette-stemming/) eingegangen. Neben der Bedeutung von Stemming für die Suchtechnologie habe ich auch den Einsatz des Porter-Stemmers in Solr beschrieben, ebenso wie die Erweiterungen durch den KeywordMarkerFilter (Wörter als Keywords markieren, um Stem...

SHI GmbH & Co. KG
SHI GmbH & Co. KG
Blog Post

LogStash-4-Solr

  • Das bekannte Programm LogStash, daß zuvor nur für Elasticsearch verfügbar war, gibt es nun auch für Solr. Die Entwickler von Lucidworks haben letzte Woche die erste Version von LogStash-4-Solr auf Ihrer WebSeite veröffentlicht.   LogStash wurde implementiert, um Log-Dateien schnell und unkompliziert in Elasticsearch zu importieren. Dabei kann über eine Konfiguration festgelegt werden, welche Teile...

Out-Market Your Competitors?

Get complete competitive insights on over 2.2 million companies to drive your marketing strategy.

Create Free Account Log in

By signing up, you agree to the Terms of Service and Privacy Policy.

Out-Market Your Competitors

Get complete competitive insights on over 2.2 million companies to drive your marketing strategy.

Create Free Account

Already a user?  Log in

By signing up, you agree to the Terms of Service and Privacy Policy.