Posts tagged: PDF

E-Books: Kostenlose Bibliothek.

E-Books im Internet

Das Internet ist nicht nur im übertragenen Sinne eine riesige Bibliothek, man findet auch tatsächlich eine Menge Bücher in elektronischer Form (Headline übrigens via Cooltext). Am weitesten verbreitet ist das PDF (wenn etwas illustriert ist), einige verwenden auch HTML (wobei dabei u. U. verknüpfte Teile verloren gehen können) und Minimalisten stehen auf reine TXT-Files. Einzelne Exemplare findet man überall im Netz, aber es gibt auch einige Sammelstellen, die alles zusammen tragen was sie finden können — deshalb muß man aufpassen, daß man nicht versehentlich urheberrechtlich geschütztes herunterlädt.

Read more »

Frequenzversteigerung: Bandbreite für alle.

Funk ist die Schlüsseltechnologie der modernen Kommunikation. Dabei ist “Fernsprechen” nur eine Nutzungsmöglichkeit von vielen und “Funk” nur ein Übertragungsweg und nicht an “Mobilität” gebunden. Am 12. April 2010 versteigert die Bundesnetzagentur 360 MHz Frequenzen, die u. a. dem Ausbau unterversorgter Regionen dienen soll.

Es geht dabei um die Frequenzbereiche 1,8 GHz, 2,0 GHz und 2,6 GHz. Besondere Bedeutung kommt der “digitalen Dividende” zu, die den Frequenzbereich 790 – 862 MHz umfaßt und sich besonders für den kostengünstigen Aufbau einer neuen Infrastruktur gerade in ländlichen Gebieten eignet.

Read more »

Von der Website zum E-Paper

Was für ein Zufall: Da steht seit Wochen das Thema Website2PDF auf meiner Aufgabenliste und nun stoße ich per Zufall auf diese schöne Übersicht: Vom Feed zum PDF-Magazin. Natürlich kann man eine Seite einfach durch einen PDF-Drucker schicken, hier geht es aber um das automatische Generieren eines “E-Papers” mit Magazin-Charakter.

Read more »

PDF für Druckerei

Es gibt eine Menge Dienstleister, die an das sauer verdiente Geld von Hobby-Webmastern, Hobby-Fotografen oder Hobby-Autoren wollen. Doch wenn man als interessierter Laie auch einmal eine Frage auf Hobby-Niveau hat, dann gibt’s oft den dumm-dreisten Hinweis, daß man nur deshalb so “billig” sei, weil es keine Beratung gebe. Dabei brauchen gerade Laien Beratung — wenn man dazu keine Lust hat, sollte man diese Zielgruppe bitte auch nicht für dumm verkaufen!

Deshalb freut sich Oberlehrer, wenn man ganz unerwartet auf hilfreiche und praxisnahe FAQs stößt, wie neulich beispielsweise zum Farbmanagement. Für ein Buch im Selbstverlag oder eine Dissertation muß man sich manchmal mit dem Thema Verlag bzw. Druckerei auseinandersetzen. Da werden einem dann oft auch technische Daten um die Ohren gehauen bei denen Fehler durchaus kostspielig ausfallen können.

Read more »

Mißbrauch von #PDF und eine kleine Hilfe

Den Textanteil aus PDF retten.

Da sind sie immer ganz stolz, die Agenturen, wenn sie die Pressemitteilungen als PDF ganz im Corporate Design versenden können.

Den Textanteil aus PDF retten.

Es ist aber eine Pest! Schließlich dienen PMs der Weiterverbreitung und Weiterbearbeitung von Informationen — wofür PDF nun nicht gerade gedacht ist. Bei den Zugriffen auf meinen Beitrag “PDF: Text und Bild extrahieren” sehe ich, daß es offenbar eine Menge Leute gibt, die Text mühsam aus solchen Dateien herausfummeln müssen.

Habe ich den Wald vor lauter Bäumen nicht gesehen oder ist es eine neue Funktion im Foxit-Reader: Unter “File | Save as…” kann man unter “Dateityp” das Textformat vorgeben — und bekommt dann eine TXT-Datei. Allerdings wird die Freude dadurch getrübt, daß der Original verwendete Blocksatz zu massenhaft überflüssigen Leerzeichen führt und auch die Fußnoten des “Briefbogens” übernommen werden.

PDF: Text und Bild extrahieren.

Immer wieder bekommt man Pressetexte u. ä. als PDF. Zwar kann man mit dem Textwerkzeug den Text via Klemmbrett in die Textverarbeitung kopieren, aber das ist mühsam, fehleranfällig — und vor allem völlig überflüssig, wenn die Agenturen nicht immer auf Effekthascherei setzen würden… — Wie kommt man nun möglichst schnell an den Text? Theoretisch könnte man sich für ein paar Hundert Euro den Adobe Destiller anschaffen und damit das Dokument öffnen. Das ist teuer und vermutlich auch nicht der eleganteste Weg. Auf dieses Problem spezialisierte Tools gibt es offline (als Desktop-Programm) und online.

Eine Online-Lösung hat den Vorteil, daß sie an jedem modernen Arbeitsplatz sofort verfügbar und nicht auf ein spezielles Betriebssystem auf dem Computer angewiesen ist. Allerdings weisen die Terms of Service zu Recht darauf hin, daß der Text während der Verarbeitung “gelesen” und gespeichert wird — das sollte einem bei allen Online-Diensten klar sein. Wer also streng vertrauliche PDFs umwandeln möchte, sollte also eine offline-Lösung bevorzugen (und ggf. den Netzwerkstecker abziehen).

PDF online bearbeiten

Mit “PDF Text Online” kann man schnell und einfach den Text aus einem PDF extrahieren. Außerdem werden Bookmarks, Formulardaten und Benutzerinformationen angezeigt. Bilder gehen allerdings verloren bzw. werden nicht angezeigt und stehen auf diesem Wege nicht zur Verfügung. Obwohl das Ergebnis zunächst seitenweise angezeigt wird, kann man bei einem anschließenden Download des gesamten Text in einer Datei herunterladen. Ob man dabei die Einstellung “visual” oder “semantic” wählt, hängt von der Mit PDF Text Online kann man schnell und einfach den Text aus einem PDF extrahieren.Textverarbeitung ab — entweder hat man zu wenige bzw. keine oder zu viele (nämlich bei jeder Zeile) eine Absatzmarke.

Mit “PDF Text Online” kann man schnell und einfach den Text aus einem PDF extrahieren.

Nachbearbeiten muß aber trotzdem: Kopf- und Fußzeilen sind entsprechend der ursprünglichen Seitenzahl mehrfach in den Text eingestreut. Auch Aufzählungen und Tabellen kann man leider nicht “formgerecht” übernehmen. Für den Brottext ist dieses Toll allerdings eine große Hilfe. Die Handhabung geht schnell und einfach vonstatten.

Read more »