PDF a text: gratuït, local, preparat per a LLM

Extraieu text d'un o molts PDFs al vostre navegador: tres estils de sortida, sense càrrega, sense registre

Drop one or more PDFs onto the page. Every file is parsed locally in your browser and returned as a clean .txt — in your choice of three styles: Standard (Unix-style form-feed between pages), Joined (clean flowing text, best for feeding into ChatGPT / Claude / any LLM), or Numbered (each page prefixed with --- Page N --- for easy reading). 100% in-browser — your PDF never leaves your device.

100% gratuït per sempre Sense compte 100% al vostre dispositiu Xifratge de grau militar
Els fitxers mai surten del dispositiu
Xifratge AES-256
No podem veure els vostres documents
No cal connexió

Deixa els teus PDFs aquí

o

No cal pujar. Tot funciona 100% localment al vostre navegador.

Com convertir un PDF a text de forma gratuïta

1. Deixeu anar un o més PDFs

Arrossegueu PDFs a la zona de desplegament de dalt o feu clic per navegar. Cada fitxer s'analitza localment; no es penja res a un servidor. S'admeten lots de diversos fitxers.

2. Trieu un estil de sortida

Estàndard (per defecte, alimentació de formulari a l'estil Unix entre pàgines), unit (sense salts de pàgina, ideal per a l'entrada de ChatGPT / Claude) o numerats (cada pàgina té el prefix --- Pàgina N ---). Cada targeta explica exactament què contindrà el .txt.

3. Converteix

Feu clic a Converteix a text. La capa de text de cada pàgina s'extreu i es transmet en un fitxer .txt UTF-8 normal. Fins i tot els PDF de 1000 pàgines solen acabar en pocs segons.

4. Descarregar individualment

La pantalla preparada mostra cada .txt de PDF com a descàrrega pròpia. Sense ZIP, sense arxius, només botons nets per fitxer, la mateixa forma que el flux de compressió.

Per què utilitzar el nostre convertidor gratuït de PDF a text?

Veritablement lliure, per sempre

Sense prova, sense mur de pagament ocult, sense càrrec per fitxer, sense límit de tasques diàries. Extreu text de tants PDF com vulguis. El servei és compatible amb anuncis, de manera que es manté gratuït per a tothom.

LLM-Ready en un clic

Trieu el mode unit i la sortida està preformatada per enganxar-la a ChatGPT, Claude, Gemini o qualsevol IA amb una entrada de text. No hi ha caràcters d'alimentació de formularis que malgastin fitxes, ni salts de línia estranys que confonguin el tokenitzador, només netegeu els paràgrafs.

Lot de fitxers múltiples

Baixa 10, 50, 200 PDFs alhora. Cadascun esdevé el seu propi fitxer .txt amb el nom de la font. Perfecte per a fluxos de treball de recerca, revisions de compliment i qualsevol treball que necessiti text de molts documents alhora.

Els fitxers no surten mai del vostre dispositiu

Tota l'extracció s'executa localment al vostre navegador. Els vostres PDFs no toquen els nostres servidors perquè no en tenim cap per als vostres fitxers; literalment, no podem veure els vostres documents.

Sense compte, sense correu electrònic

Comenceu a extreure immediatament. Sense registre, cap captura de correu electrònic, sense targeta de crèdit. La manera com funcionava el programari d'escriptori abans de les "proves gratuïtes".

Cap mida de fitxer cap

L'extracció de text és un càlcul barat, no cal limitar la mida d'entrada. Un PDF de 2 GB amb 10.000 pàgines d'extractes de text en menys d'un minut en un ordinador portàtil típic.

Sense filigrana

El .txt només conté el que hi havia al PDF. Sense cap capçalera "convertit amb...", sense enllaç al peu de pàgina, sense marca.

Funciona fora de línia

Un cop carregada aquesta pàgina, podeu desconnectar-vos d'Internet i l'extractor encara funciona. Ideal per a PDFs confidencials que preferiu processar sense xarxa.

Els tres estils de sortida, explicats

Estàndard: el valor predeterminat d'Unix

Each page's text is followed by a form-feed character (\f, ASCII 12) before the next page begins. This is exactly what the command-line pdftotext utility produces — so anything downstream (Python scripts, awk pipelines, older text editors) treats the output identically. Pick this when you're replacing a pdftotext run.

S'ha unit — per a l'entrada de LLM

Every page break is removed. Pages are separated by a blank line, not a form-feed. The result is one flowing text — ideal for pasting into ChatGPT / Claude / Gemini / any LLM, because those models don't parse \f usefully and each one of those characters costs a token.

Numerat: per a la lectura humana

Each page is prefixed with --- Page N --- on its own line so you can navigate the .txt in a regular text editor and still see where one page ends and the next begins. Useful for reviewing extracted text manually, or attaching text alongside the original PDF for reference.

Important: PDFs escanejats Necessita OCR

If your PDF is a scan — pure images of text with no embedded text layer — this converter will return nothing (or very little). We extract the text that's already in the PDF. Converting images of text to text requires OCR (optical character recognition), which needs a 2MB+ library and deserves its own dedicated tool. We're honest about that limit instead of silently running a weak OCR and returning garbage. To test: open your PDF in any viewer and try selecting text with your mouse. If text highlights, this converter will extract it. If the page highlights as one giant image, you need OCR.

PDF Edit vs FreeConvert, PDF2Go, Smallpdf, pdftotext.com

Funció PDF Edit FreeConvert PDF2Go Smallpdf pdftotext.com
Fitxers pujats a un servidor? No — 100% local
Lot de diversos fitxers? Unlimited 1 a la vegadaNomés de pagamentNomés de pagament1 a la vegada
Estils de sortida? 3 (Standard / Joined / Numbered) 1111
Sortida preparada per a LLM? Yes (Joined) NoNoNoNo
Cal un compte? Never Nivell gratuït limitat Nivell gratuït limitat Nivell gratuït limitat No
Límit diari de fitxers? None 5/hora Talla + majúscules de recompte 2/hora Talla de gorra
Marca d'aigua a la sortida? No NoNoNoNo
Funciona sense connexió després de carregar? Yes NoNoNoNo

Quan els vostres PDFs contenen alguna cosa que preferiu no publicar (esborranys, resums de clients, notes internes, dades d'investigació), la diferència entre només local i pujar primer no és una característica convenient. És tot el camp.

Qui converteix PDFs a text?

Alimentació de PDFs a ChatGPT / Claude

Cada LLM té una entrada de text, no una entrada PDF. Converteix amb el mode unit i enganxeu el .txt al vostre indicador. Els fitxes es mantenen eficients; el model llegeix el vostre document sense cap tipus de fontaneria PDF en el camí.

Recerca i revisió acadèmica

Col·loqueu 50 PDFs de diari alhora, convertiu-los tots en un sol lot i cerqueu / grep el corpus de text. Molt més ràpid que Ctrl+F-ing dins de 50 visors PDF separats.

Citació i citació

Traieu fragments específics de contractes, informes o documents per utilitzar-los en correus electrònics, notes o articles. L'extracció de text conserva la redacció exacta de manera que les cites es mantenen exactes.

Extracció i anàlisi de dades

Financial statements, lab reports, tabular data — get the text out and feed it into spreadsheets, Python scripts, or data pipelines. Standard mode (with form-feed) cooperates nicely with awk / sed / CSV parsers.

Arxiu i indexació de cerca

Converteix un arxiu de documents en text cercable. Indexa els fitxers .txt amb ripgrep, Lunr, Meilisearch o qualsevol motor de cerca de text complet. PDF-la cerca nativa és lenta; la cerca de text és instantània.

Accessibilitat i lectors de pantalla

Els fitxers nets .txt són el format més accessible: tots els lectors de pantalla els parlen de manera nativa, sense cap peculiaritat del motor PDF. Ideal per compartir contingut amb lectors amb discapacitat visual o públic que prefereix interfícies de veu.

PDF per enviar missatges de text a qualsevol dispositiu

El nostre convertidor de PDF a text funciona en qualsevol dispositiu amb un navegador modern: Windows, Mac, Linux, Chromebook, iPad, iPhone i Android. No cal instal·lar cap programari, no es necessiten connectors, no es requereixen drets d'administrador. Un cop s'hagi carregat la pàgina, podeu desconnectar-vos d'Internet i continuar l'extracció: tot funciona de manera local.

Com funciona l'extracció de text basat en el navegador PDF?

Your PDF is parsed page by page inside your browser. Every text item is sorted into reading order (top-to-bottom, left-to-right, respecting columns when possible) and serialised as UTF-8 plain text. Page breaks are inserted as form-feed characters (Standard mode), removed entirely (Joined mode), or replaced with --- Page N --- headers (Numbered mode). No server involved at any step — your PDF stays in device memory the whole time.

Preguntes freqüents

Com puc convertir un PDF a text de forma gratuïta?

Deixeu anar els vostres PDF a la pàgina de dalt, trieu un estil de sortida i feu clic a Converteix a text. Cada PDF es converteix en el seu propi fitxer .txt descarregat localment.

Quin estil de sortida és millor per a ChatGPT / Claude / LLM?

S'ha unit. Elimina els salts de pàgina (que malgasten fitxes) i produeix text net i fluid que el model pot llegir com a paràgrafs naturals.

El meu PDF està penjat a un servidor?

No. L'extracció s'executa completament al vostre navegador. El vostre PDF no toca mai els nostres servidors; no en tenim cap per als vostres fitxers.

Puc convertir un PDF escanejat a text?

No amb aquesta eina. Extraiem la capa de text incrustada al PDF. Les exploracions (imatges de text sense capes de text) necessiten OCR, que és una biblioteca separada i mereix la seva pròpia eina. Per provar: proveu de seleccionar text al vostre visor PDF; si el text destaca, l'extraurem; si la pàgina es destaca com una imatge, necessiteu OCR.

Puc convertir diversos PDFs alhora?

Sí. Deixa'n caure tants com vulguis. Cadascun es converteix en el seu propi fitxer .txt a la pantalla preparada: sense ZIP, sense arxius, només descàrregues individuals.

El text conserva la disposició?

Aproximadament sí — l'ordre de lectura, els salts de línia i l'estructura de columnes es preserven quan el PDF té una capa de text correcta. Les maquetacions complexes (revistes de dos columnes, taules pesades) de vegades s'intercalen de manera estranya. Per a una fidelitat de maquetació perfecta, feu servir /pdf-to-word.html.

Hi ha un límit de mida del fitxer?

Sense límit artificial. L'extracció de text és barata: fins i tot un PDF de 2 GB amb desenes de milers de pàgines sol acabar en menys d'un minut en un ordinador portàtil modern.

El .txt té una marca d'aigua o una atribució?

No. Només el text del teu PDF, res afegit. Sense capçaleres, sense enllaços al peu de pàgina, sense línia "convertit amb...".

Necessito un compte?

No. Sense registre, sense correu electrònic, sense captcha, sense targeta de crèdit.

Funciona fora de línia?

Sí, un cop carregada la pàgina. Tot s'executa al vostre navegador: desconnecteu-vos i seguiu extraient.

Last updated:

About this tool: PDF Edit is built by a small independent team who were tired of online tools uploading user files to servers they didn't control. Everything here runs in your browser — your PDF stays on your device, there's no size limit, no signup, and no watermark on the text output. Three output styles (Standard / Joined / Numbered) give you the format you actually need. Free forever, ad-supported. Reach out via the footer links with bugs or feature requests.