Skaner to urządzenie wejścia (input device), które zamienia fizyczny dokument, zdjęcie albo inny płaski obiekt na obraz cyfrowy. Mówiąc prościej: bierze kartkę, oświetla ją i mierzy, ile światła odbija się od każdego punktu, a wynik zapisuje jako mapę pikseli. Z perspektywy komputera skaner to po prostu kolejne źródło danych, tyle że zamiast klawiszy podaje na wejściu obrazek.
Jak to działa i do czego służy
W typowym skanerze płaskim (flatbed) pod szybą jedzie ruchoma głowica z liniowym czujnikiem (CCD lub CIS) i źródłem światła. Linia po linii czujnik odczytuje jasność i kolor, a elektronika składa z tego pełny obraz. Kluczowy parametr to rozdzielczość optyczna podawana w dpi (punkty na cal) — np. 600 dpi do dokumentów, 2400 dpi i więcej do zdjęć czy slajdów. Nie myl rozdzielczości optycznej z interpolowaną: ta druga to dorysowane piksele, a nie realny detal.
Po co Ci to w IT? Głównie do digitalizacji: faktury, umowy, dokumenty do archiwum, czy stary album zdjęć. Sam obraz to jednak dopiero połowa roboty — żeby z zeskanowanej kartki zrobić tekst do przeszukiwania, dokładasz OCR (Optical Character Recognition), które rozpoznaje litery na obrazie.
Przykład z praktyki
Na Linuksie skanery obsługuje SANE. Listę podłączonych urządzeń sprawdzisz komendą scanimage -L, a pojedynczy skan zapiszesz tak:
scanimage --resolution 300 --format=tiff > faktura.tiff
Dalej puszczasz to przez OCR, np. tesseract faktura.tiff faktura -l pol, i z obrazka robi się przeszukiwalny tekst albo PDF z warstwą tekstową. Cała ta ścieżka — skan plus OCR plus zapis do PDF — to fundament każdego sensownego systemu obiegu dokumentów.
Częste błędy i mity
Po pierwsze: większa liczba dpi nie zawsze jest lepsza. Skan dokumentu w 4800 dpi to plik na kilkaset MB i zero zysku — do tekstu wystarczy 300 dpi. Po drugie: urządzenie wielofunkcyjne (drukarka, skaner i kopiarka w jednym) bywa wygodne, ale jakość skanu zdjęć jest tam zwykle przeciętna. Po trzecie: skaner kodów kreskowych albo skaner sieci (jak nmap) to zupełnie inne „skanery” — ta sama nazwa, inny świat. Warto wiedzieć, w jakim kontekście ktoś tego słowa używa.
Pojęcia powiązane
OCR, dpi, urządzenie wejścia, urządzenie wielofunkcyjne (MFP), czujnik CCD i CIS, sterownik SANE/TWAIN, format TIFF i PDF.