PDF ji nivîsê re - Belaş, Herêmî, LLM-Amade ye
Di geroka xwe de nivîsê ji yek an gelek PDF derxînin - sê şêwazên derketinê, bê barkirin, bê qeydkirin
Drop one or more PDFs onto the page. Every file is parsed locally in your browser and returned as a clean .txt — in your choice of three styles: Standard (Unix-style form-feed between pages), Joined (clean flowing text, best for feeding into ChatGPT / Claude / any LLM), or Numbered (each page prefixed with --- Page N --- for easy reading). 100% in-browser — your PDF never leaves your device.
PDFên xwe davêjin vir
an
Ne barkirin hewce ye. Her tişt 100% herêmî di geroka we de dixebite.
Meriv çawa PDFek belaş ji nivîsê veguherîne
1. Yek an jî zêdetir PDFs davêjin
PDFs kaş bikin li ser qada avêtinê ya li jor, an jî bikirtînin ku lê bigerin. Her pel bi herêmî tê analîz kirin - tiştek li serverek nayê barkirin. Komên pir-pel têne piştgirî kirin.
2. Şêweyek encam hilbijêrin
Standard (xweserî, di navbera rûpelan de bi şêwaza Unix vexwarinê), Tevlî (rûpel nayê veqetandin, ji bo têketina ChatGPT / Claude îdeal), an Hejmarkirî (her rûpelek bi --- Rûpel N --- tê pêşgirkirin). Her kart tam diyar dike ku .txt dê çi hebe.
3. Veguherandin
Bikirtînin Convert to Text. Tewra nivîsê ya her rûpelê tê derxistin û di pelek UTF-8 .txt ya sade de tê derxistin. Tewra PDFên 1000-rûpel bi gelemperî di çend saniyan de diqede.
4. Daxistina takekesî
Dîmena amade her PDF .txt wekî dakêşana xwe destnîşan dike. Bê ZIP, bê arşîv - tenê bişkokên per-pelê paqij bikin, heman şiklê herikîna berhevkirinê.
Çima PDF-ya meya belaş ji Veguhezkara Nivîsarê re bikar bînin?
Bi rastî Azad, Herheyî
Ne ceribandin, ne paywallek veşartî, ne heqê per-pelê, ne sînorê karê rojane. Bi qasî ku hûn dixwazin nivîsê ji gelek PDFs derxînin. Karûbar ji hêla reklamê ve tê piştgirî kirin ji ber vê yekê ew ji bo her kesî belaş dimîne.
LLM-Di Yek klîk de amade ye
Moda Tevlêbûnê hilbijêrin û derketin pêş-formatkirî ye ji bo ku li ChatGPT, Claude, Gemini, an her AI-ê bi têketina nivîsê ve were girêdan. Tu tîpên form-xwarinê nîşanan xera dikin, ti rêzek xerîb naşkêne ku tokenîzatorê tevlihev dike - tenê paragrafên paqij.
Parçeyek Pir-Pel
Yekcar 10, 50, 200 PDFs davêjin. Her yek dibe pela xwe ya .txt ku navê çavkaniyê lê tê kirin. Ji bo xebatên lêkolînê, vekolînên lihevhatinê, û her karê ku hewcedariya nivîsê ji gelek belgeyan bi yekcarî heye, bêkêmasî ye.
Pelên Qet Ji Amûra Xwe Terk Nekin
Hemî derxistin di geroka we de herêmî dimeşe. PDFên we destê xwe nadin serverên me ji ber ku pelên we tune ne - em bi rastî nikarin belgeyên we bibînin.
Hesab tune, Email tune
Tavilê dest bi derxistinê bikin. Ne qeydkirin, ne girtina e-name, ne qerta krediyê. Awayê ku nermalava sermaseyê berî "ceribandinên belaş" dixebitî.
No Cap Size Pelê
Derxistina nivîsê hesabek erzan e - ne hewce ye ku mezinahiya têketinê were girtin. 2 GB PDF bi 10,000 rûpelên jêderkên nivîsê di binê deqeyekê de li ser laptopek tîpîk.
Ne Watermark
.txt tenê tiştên ku di PDF de bû dihewîne. Ne sernivîsek "bi… veguherandine", ne girêdana pêlavê, ne jî marqe.
Offline dixebite
Piştî ku ev rûpel hat barkirin, hûn dikarin ji înternetê qut bibin û derhêner hîn jî dixebite. Ji bo PDF-ên nepenî mezin e ku hûn bêyî torgilokê pêvajoyê bikin.
Sê şêwazên derketinê, şirove kirin
Standard - Unix default
Each page's text is followed by a form-feed character (\f, ASCII 12) before the next page begins. This is exactly what the command-line pdftotext utility produces — so anything downstream (Python scripts, awk pipelines, older text editors) treats the output identically. Pick this when you're replacing a pdftotext run.
Tevlî - ji bo têketina LLM
Every page break is removed. Pages are separated by a blank line, not a form-feed. The result is one flowing text — ideal for pasting into ChatGPT / Claude / Gemini / any LLM, because those models don't parse \f usefully and each one of those characters costs a token.
Jimarkirî - ji bo xwendina mirovan
Each page is prefixed with --- Page N --- on its own line so you can navigate the .txt in a regular text editor and still see where one page ends and the next begins. Useful for reviewing extracted text manually, or attaching text alongside the original PDF for reference.
Girîng: PDFs skankirî Pêdiviya OCR
If your PDF is a scan — pure images of text with no embedded text layer — this converter will return nothing (or very little). We extract the text that's already in the PDF. Converting images of text to text requires OCR (optical character recognition), which needs a 2MB+ library and deserves its own dedicated tool. We're honest about that limit instead of silently running a weak OCR and returning garbage. To test: open your PDF in any viewer and try selecting text with your mouse. If text highlights, this converter will extract it. If the page highlights as one giant image, you need OCR.
PDF Edit vs FreeConvert, PDF2Go, Smallpdf, pdftotext.com
| Taybetî | PDF Guherandin | FreeConvert | PDF2Go | Smallpdf | pdftotext.com |
|---|---|---|---|---|---|
| Dosya li serverek barkirin? | No — 100% local | Erê | Erê | Erê | Erê |
| Parçeyek pir-pelî? | Unlimited | 1 di demekê de | Tenê dayîn | Tenê dayîn | 1 di demekê de |
| Şêwazên derketinê? | 3 (Standard / Joined / Numbered) | 1 | 1 | 1 | 1 |
| Hilberîna LLM-amade ye? | Yes (Joined) | Na | Na | Na | Na |
| Hesab hewce ye? | Never | Asta belaş bi sînor | Asta belaş bi sînor | Asta belaş bi sînor | Na |
| Sînorê dosyaya roj? | None | 5 / saet | Pîvan + hejmartin | 2 / saet | Pîvana mezinbûnê |
| Nîşaneya avê li derxistanê? | No | Na | Na | Na | Na |
| Paşî barkirinê di derveyê karkirin? | Yes | Na | Na | Na | Na |
Gava ku PDF-yên we her tiştê ku hûn nexwazin neweşînin hene - pêşnûme, kurtenivîsên xerîdar, bîranînên hundurîn, daneyên lêkolînê - ferqa di navbera herêmî-tenê û barkirina yekem de ne taybetmendiyek rehet e. Tevahiya meydanê ye.
Kî PDFs vediguherîne nivîsê?
PDFs ji ChatGPT / Claude re tê xwarin
Her LLM têketinek nivîsê heye - ne têketinek PDF. Bi moda Tevlêbûnê veguherînin û .txt-ê di nameya xwe de bixin. Tokens bi bandor dimînin; modela belgeya we bêyî ku di rê de qutkirina PDF dixwîne.
Lêkolîn û lêkolîna akademîk
50 rojnameyên PDF bi carekê davêjin, wan hemî di yek komê de biguherînin, û li korpusa nivîsê grep / bigerin. Di hundurê 50 temaşevanên PDF yên cihêreng de ji Ctrl + F-ing pir zûtir e.
Çêkirin û vegotin
Ji bo karanîna di e-name, bîranîn, an gotaran de ji peyman, rapor, an kaxizên taybetî derxînin. Derxistina nivîsê peyva rast diparêze ji ber vê yekê vegotin rast bimîne.
Derxistina daneyan û analîzkirin
Financial statements, lab reports, tabular data — get the text out and feed it into spreadsheets, Python scripts, or data pipelines. Standard mode (with form-feed) cooperates nicely with awk / sed / CSV parsers.
Arşîvkirin û îndekskirina lêgerînê
Arşîva belgeyê veguherînin nivîsa lêgerînê. Pelên .txt bi ripgrep, Lunr, Meilisearch, an jî motora lêgerînê ya tev-text nîşan bidin. PDF-lêgerîna xwemalî hêdî ye; lêgerîna nivîsê tavilê ye.
Gihîştin û xwendevanên ekranê
Pelên .txt ên paqij formata herî gihîştî ne - her xwendevanek ekranê wan bi xwemalî diaxive, ne qursên motora PDF. Ji bo parvekirina naverokê bi xwendevanên bi qelsî yên dîtbar an temaşevanên ku navbeynkariya deng tercîh dikin re mezin e.
PDF li ser Her Amûrek Nivîsarê
Veguhezkarê meya PDF bo nivîsê li ser her amûrek bi gerokek nûjen dixebite - Windows, Mac, Linux, Chromebook, iPad, iPhone, û Android. Ne nermalava sazkirinê, ne pêvek hewce ne, ne mafên rêveberiyê hewce ne. Piştî ku rûpel hat barkirin, hûn dikarin ji înternetê qut bibin û derxistina xwe bidomînin - her tişt bi herêmî dimeşîne.
PDF-based gerokê ji bo derxistina nivîsê çawa dixebite?
Your PDF is parsed page by page inside your browser. Every text item is sorted into reading order (top-to-bottom, left-to-right, respecting columns when possible) and serialised as UTF-8 plain text. Page breaks are inserted as form-feed characters (Standard mode), removed entirely (Joined mode), or replaced with --- Page N --- headers (Numbered mode). No server involved at any step — your PDF stays in device memory the whole time.
Pirsên Pir Pir Dipirsin
Ez çawa dikarim PDF belaş ji nivîsê veguherînim?
PDF(ên) xwe davêjin ser rûpela li jor, şêwazek derketinê hilbijêrin, bikirtînin Veguherandina Nivîsarê. Her PDF dibe dosyaya xwe ya .txt ku li herêmê tê daxistin.
Kîjan şêwaza derketinê ji bo ChatGPT / Claude / LLM çêtirîn e?
Tevlî bûn. Ew şikestinên rûpelan (ku nîşanekan xera dike) vediqetîne û metna herikîna paqij çêdike ku model dikare wekî paragrafên xwezayî bixwîne.
Ma PDF min li serverek hatî barkirin?
Na. Derxistin bi tevahî di geroka we de dixebite. PDF-ya we tu carî dest nade serverên me - ji bo pelên we yên me tune.
Ma ez dikarim PDF-ya skankirî veguherînim nivîsê?
Ne bi vê amûrê. Em qata nivîsê ya ku di PDF-ê de cih girtiye derdixin. Scans (wêneyên nivîsê yên bêyî qatek nivîsê) hewceyê OCR e, ku pirtûkxaneyek cihê ye û amûrek xwe heq dike. Ji bo ceribandinê: biceribînin nivîsê di temaşevana PDF de hilbijêrin - heke nivîs ronî bibe, em ê jê derxin; heke rûpel wekî yek wêneyê ronî bike, hûn OCR hewce ne.
Ez dikarim bi yekcarî gelek PDF biguherim?
Erê. Bi qasî ku hûn dixwazin bavêjin. Her yek dibe pelê xweya .txt li ser ekrana amade - bê ZIP, bê arşîv, tenê dakêşanên kesane.
Nivîsar layoutê diparêze?
Hema bêje erê - rêzika xwendinê, şikestinên rêzan, û avahiya stûnê têne parastin dema kuPDFxwedan qatek nivîsê ya rast be. Plansaziyên tevlihev (kovarên du stûnî, tabloyên giran) carinan bi rengek ecêb dikevin nav hev. Ji bo dilsoziya sêwirana bêkêmasî li şûna/pdf-to-word.htmlbikar bînin.
Sînorek mezinahiya pelê heye?
No sînorê sûnî. Derxistina nivîsê erzan e - tewra PDFek 2 GB bi deh hezaran rûpelan bi gelemperî li ser laptopek nûjen di binê deqîqeyek de qediya.
Di .txt de nîşanek an jêderk heye?
Na, tenê nivîsa PDF-ya we, tiştek zêde nebû. Ne sernivîs, ne girêdanên pêlavê, ne rêzika "bi… veguherandine".
Ma ji min re hesabek pêdivî ye?
Na no qeyd, bê e-name, ne captcha, ne qerta krediyê.
Ma ew negirêdayî dixebite?
Erê, gava ku rûpel hatiye barkirin. Her tişt di geroka we de dimeşe - veqetînin û derxistinê bidomînin.
Last updated: