|
|
Die Verfahren der Lemmatisierung (Grundformerzeugung) und Kompositazerlegung haben
wir zusammen mit einem Flexer (für die Erzeugung von flektierten Wortformen) in
einem Modul zusammengefasst, das einfach in Ihre Applikationen integriert werden
kann. Sei es als qualitatives Add-On für Ihre bestehende Suchmaschine, für Ihr Dokumenten-
oder Content-Management-System bzw. Ihre Portal- oder Shopanwendung oder in Kombination
mit unserem iFinder.
In der Morphologie-Software LiSa haben wir Verfahren zur linguistischen und statistischen
Texterschließung kombiniert, um flektierte Wörter (Vollformen) auf ihre Grundformen
zu normalisieren und um zusammengesetzte Begriffe in ihre Grundbestandteile zu zerlegen.
Zusätzlich werden auch einfache Wortkategorien (Substantiv, Verb, Adjektiv, Funktional)
geliefert. Die LiSa- Bibliothek ist vielseitig einsetzbar, und immer dann nützlich,
wenn Wort-Flexionen für die weitere Analyse keine Rolle spielen sollen, z.B. für
- Volltextsuche
- Indizierung
- Textklassifikation und Document-Routing
- Erstellung von Wortfiltern
- Erkennung von Spezial-Terminologie
- Suchhilfen für DMS und CMS
- Automatic-Abstracting
Unser erfahrenes Team von Computer-Linguisten verfügt über 20-jährige Erfahrung
in Forschung und Entwicklung im Bereich Textdaten-banken, Information-Retrieval
sowie Indexing und ist unser Garant für höchste Produktqualität – unsere zahlreichen
Verlagsreferenzen belegen dies eindeutig.
Die linguistischen Verfahren basieren auf umfassenden Lexikonbeständen und zeichnen
sich durch eine stark prozedurale Orientierung in der Lexikon-Analyse aus. Linguistische
Ergebnisse werden also hierbei, im Gegensatz zu vergleichbaren Verfahren, stärker
über Prozeduren „berechnet“ als im Lexikon „nachgeschlagen“.
Es ist, insbesondere für morphologisch komplexe Sprachen wie Deutsch, praktisch
nicht möglich, umfassende Lexika zu erstellen. Vor diesem Hintergrund arbeiten die
linguistischen Tools von IntraFind auf der Grundlage von Basislexika (Vollformen-Grundformen
Mapping) mit den morphologischen Elementarbausteinen einer Sprache. Diese Bausteine
können, ebenso wie die kombinatorischen Regeln für diese Bausteine, mit einem hohen
Vollständigkeitsgrad ermittelt und angewandt werden. Insbesondere bei der Erstellung
von Kombinationsregeln spielen statistische Analysen eine Rolle.
Auf dieser Grundlage verfolgt IntraFind, im Gegensatz zu anderen Anbietern, nicht
die Strategie „je größer das Lexikon, desto leistungs-fähiger das Verfahren“ – was
sich in der Preisgestaltung kommerzieller Anbieter zeigt:
je umfangreicher die Lexika, desto teurer wird das angebotene System.
IntraFind bietet ein umfassendes Paket: Lexika und Prozeduren unter-scheiden sich
von einer Version zur anderen nur bezüglich der Qualität,
nicht aber durch wesentlich umfangreichere Lexika.
Bei den in LiSa implementierten Funktionen handelt es sich um Verfahren zur
- automatischen Normalisierung auf Wort-Grundformen: LEMMATISER
- automatischen Zerlegung von Mehrworteinheiten: DECOMPOSER
|
So können Sie LiSa nutzen:
LiSa als OEM-Toolbox für Ihre Eigenentwicklung
LiSa integriert in unsere intelligente Suchmaschine
iFinder – als Komplettpaket
LiSa als qualitative Erweiterung Ihrer eigenen Software-Applikation
(z.B. bei bestehender Suchmaschine wird der FLEXER zur automatischen Erweiterung
der Suchfrage benutzt)
LiSa als Spell-Checker für die automatische Korrektur
von Tippfehlern.
Hochwertige Liguistik
in folgenden Sprachen verfügbar:
Deutsch, Englisch, Spanisch, Französisch, Italienisch,
Niederländisch, Russisch, Polnisch, Serbo-Kroatisch, Griechisch, Chinesisch-
Tokenizer, Stemmer Arabisch+Pasthu |