Keď používate Office 2011 pre Mac, čoskoro zistíte, že Word 2011 dokáže otvárať webové stránky, ktoré ste si uložili z webového prehliadača. Ak webová stránka obsahuje tabuľku HTML (HyperText Markup Language), môžete použiť funkcie tabuľky programu Word. Možno bude pre vás jednoduchšie skopírovať len časť tabuľky webovej stránky z webového dokumentu a prilepiť ju do funkčného dokumentu programu Word.
V určitom okamihu môžete naraziť na súbor PDF (Portable Document Format), ktorý obsahuje cenné tabuľkové informácie, ktoré chcete extrahovať. Ak sú informácie o tabuľke v dokumente PDF založené na texte a nie na naskenovanom obrázku, môžete použiť aplikáciu Náhľad v systéme Mac OS X, aby ste získali informácie o tabuľke. Nasleduj tieto kroky:
Otvorte súbor PDF v aplikácii Mac OS X Preview.
V Ukážke vyberte Upraviť → Vybrať všetko.
V Ukážke vyberte Upraviť → Kopírovať.
Prepnite sa do programu Microsoft Word kliknutím na ikonu Dock programu Word alebo použite spôsob, ktorý zvyčajne používate na prepínanie alebo spúšťanie aplikácií.
Uistite sa, že máte otvorený nový alebo existujúci dokument.
Vo Worde vyberte Upraviť → Prilepiť.
Možno budete musieť ručne odstrániť nadbytočné informácie. Ak text nebol vložený, súbor PDF pravdepodobne neobsahuje žiadny text alebo je uzamknutý a túto metódu nemôžete použiť na získanie údajov. Ak je to tak, tu sa musíte zastaviť. Ak bol text vložený, pokračujte.
Vo Worde vyberte prilepený text, ktorý je potrebné previesť na tabuľku.
Preveďte výber textu na tabuľku výberom položky Tabuľka → Konvertovať → Previesť text na tabuľku.
Word z údajov vytvorí tabuľku.
Súbory PDF môžu obsahovať tabuľky, ktoré boli uložené ako obrázky, rovnako ako webové stránky a iné dokumenty, ktoré môžete nájsť online. Ak je to tak, na konverziu obrázkov textu na skutočný text potrebujete softvér na optické rozpoznávanie znakov (OCR). Softvér OCR nie je súčasťou balíka Office. Je známe, že lacné skenery sa dodávajú s vysokokvalitným softvérom OCR, ktorý stojí ešte viac ako skener. ReadIris (www.readiris.com) je vynikajúci pre OCR.