Skip to main content

INDXR

umieszczanie warstw tekstowych na skanach materiałów źródłowych czyli indeksowanie jako niepełnotekstowe adnotowanie dużych kolekcji obrazów, w oparciu o bazę danych.

INDXR to platforma za pomocą której można: tworzyć repozytoria skanów, indeksować obejmowane przez nie treści, identyfikować miejscowości, osoby lub inne podmioty występujące w materiałach źródłowych, harmonizować treść anotacji z zewnętrznymi bazami danych, publikować dane w postaci usług i aplikacji, analizować anotacje, integrować zewnętrzne usługi ułatwiające wprowadzanie danych (np. OCR, HTR), przetwarzać dane do postaci Linked Data, lokalizować obiekty przestrzenne na mapie.

INDXR

to nie tylko aplikacja komputerowa

INDXR to przede wszystkim idea, którą można implementować z wykorzystaniem różnych narzędzi obsługujących dane typu przestrzennego. Jej główna cecha to „No vendor lock” i korzystanie z otwartych standardów. Dzięki czemu dane mogą być przetwarzane, również w zakresie anotowania, za pomocą wielu niezależnych, uniwersalnych aplikacji, które można przyłączać do tych samych usług lub bazy danych z których korzysta referencyjna aplikacja INDXR. Działa ona w chmurze i w jej ramach skupione zostały najbardziej typowe i najczęściej wykorzystywane funkcjonalności.

Najważniejsze cechy

Możliwość anotowania dowolnego tekstu i obrazu

Optymalizacje ułatwiające wykonywanie powtarzalnych czynności wprowadzania danych

Integracja z usługami OCR/HTR, OGC(GIS), IIIF, SPARQL

Wykorzystywanie kontrolowanych słowników

Współpraca wielu użytkowników w trybie rzeczywistym

Trwały dostęp do danych niezależny od używanej aplikacji

Wydajność niezależna od ilości danych

Architektura uwzględniająca interoperacyjność, otwarte standardy i skalowalność

Permalinki do anotacji, stron, miejsc na skanach

Dostosowywalne dynamiczne formularze anotacji

API dostępu do danych. Zbuduj własną aplikację w oparciu o utworzoną bazę danych

Ważne!
INDXR to jednocześnie:

Idea którą można wykorzystać niezależnie od aplikacji w chmurze, dobierając odpowiednie dla siebie i swojego zastosowania, kompatybilne ze standardami danych przestrzennych narzędzia


Platforma usługowa z referencyjnymi aplikacjami internetowymi działającymi w chmurze.

JAK TO DZIAŁA

i czym się różni?

Fundamentalnym założeniem zarówno idei jak i aplikacji INDXR jest wykorzystywanie specjalnego typu danych: geometry, istniejącego obecnie w większości baz danych. To przestrzeń jest elementem łączącym anotacje z obrazami które one opisują. INDXR jest więc specyficznym systemem informacji przestrzennej. Specyficznym dlatego że dotyczy „bliskiej” przestrzeni, a nie jak większość typowych systemów informacji przestrzennej, przestrzeni „dalekiej” czyli geograficznej. Jednakże technologia obsługi takich danych dotyczących bliskiej przestrzeni może być taka sama jak przestrzeni dalekiej. Dzięki temu możliwe jest adaptowanie dowolnych komponentów ogromnego zbioru dojrzałego oprogramowania klasy GIS, zamiast kosztownego i czasochłonnego tworzenia od podstaw całkowicie niezależnych technologii.

Typowy przypadek użycia

Krok 1: Tworzenie repozytorium ze skanami. Jeśli wykorzystywana jest aplikacja INDXR, to skany umieszczane są na platformie INDXR gdzie następuje ich przetworzenie do repozytorium typu kolekcja skanów. Jeśli natomiast wykorzystywane jest inne narzędzie to skany muszą w nim zostać ułożone w odpowiedniej kolejności.
W rezultacie otrzymujemy od tego momentu możliwość przeglądania skanów: na serwerze, przez przeglądarkę, lub lokalnie za pomocą dowolnej aplikacji desktopowej obsługującej dane przestrzenne, lub na serwerze za pomocą dowolnej aplikacji desktopowej obsługującej standard WMS/IIIF, lub na serwerze za pomocą innych aplikacji internetowych obsługujących standard WMS/IIIF

Krok 2: Indeksowanie. Tworzona jest warstwa informacyjna zawierająca anotacje. Strukturę anotacji można samodzielnie modelować. W najprostszym przypadku, w aplikacji INDXR, należy określić zestaw pól opisujących kategorię danych, w tym przypadku miejscowości.
Od tego momentu można rozpocząć indeksowanie.

DO CZEGO

to można wykorzystać?

Indeksowanie czyli niepełnotekstowa transformacja zawartości skanów w treść bazodanową z zachowaniem powiązania między wpisami w bazie danych a ich lokalizacją na skanach materiałów źródłowych. Używana metoda zapisu danych jest niezależna od stosowanej aplikacji. Efektem końcowym są usługi dostępu do obrazów skanów oraz zawartych na nich treści, zgodne z powszechnie używanymi standardami i możliwe do użycia w dowolnej aplikacji.

INDXR wykorzystuje technologie przestrzenne baz danych (typ geometryczny). Może być także postrzegany jako internetowa platforma do wieloużytkownikowej transkrypcji, a następnie publikacji historycznych rękopisów, z zachowaniem powiązania między wpisami bazodanowymi a miejscami na skanach rękopisów.

W przypadku używania przez pojedynczego zaawansowanego użytkownika możliwe jest użycie dowolnej aplikacji desktop obsługującej dane przestrzenne (np. QGIS). Jednak w przypadku mniej zaawansowanych użytkowników, i/lub współużytkowania zbiorów danych (warstw) z wieloma osobami, i/lub w bardziej złożonych projektach, wygodniejsze jest skorzystanie z usługi w chmurze.

INDXR jest częścią infrastruktury Dariah.lab stworzonej w ramach projektu DARIAH-PL