PDF به متن - رایگان، محلی، LLM-Ready
متن را از یک یا چند PDF در مرورگر خود استخراج کنید - سه سبک خروجی، بدون آپلود، بدون ثبت نام
Drop one or more PDFs onto the page. Every file is parsed locally in your browser and returned as a clean .txt — in your choice of three styles: Standard (Unix-style form-feed between pages), Joined (clean flowing text, best for feeding into ChatGPT / Claude / any LLM), or Numbered (each page prefixed with --- Page N --- for easy reading). 100% in-browser — your PDF never leaves your device.
PDFs خود را اینجا بگذارید
یا
نیازی به آپلود نیست همه چیز 100٪ به صورت محلی در مرورگر شما اجرا می شود.
چگونه یک PDF را به صورت رایگان به متن تبدیل کنیم
1. یک یا چند PDFs را رها کنید
PDFs را به منطقه رها کردن بالا بکشید یا برای مرور کلیک کنید. هر فایل به صورت محلی تجزیه و تحلیل می شود - هیچ چیزی در سرور آپلود نمی شود. دسته های چند فایلی پشتیبانی می شوند.
2. یک سبک خروجی را انتخاب کنید
استاندارد (پیشفرض، فید فرم به سبک یونیکس بین صفحات)، Joined (بدون شکستن صفحه، ایدهآل برای ورودی ChatGPT / Claude)، یا شمارهدار (هر صفحه با پیشوند --- Page N ---). هر کارت دقیقاً توضیح می دهد که txt.
3. تبدیل کنید
روی تبدیل به متن کلیک کنید. لایه متنی هر صفحه استخراج شده و در یک فایل txt. UTF-8 ساده پخش می شود. حتی PDF های 1000 صفحه ای معمولاً در چند ثانیه تمام می شوند.
4. دانلود به صورت جداگانه
صفحه آماده هر PDF .txt را به عنوان دانلود خود فهرست می کند. بدون ZIP، بدون بایگانی - فقط دکمه های هر فایل را تمیز کنید، همان شکل جریان فشرده سازی.
چرا از مبدل رایگان PDF به متن استفاده کنیم؟
واقعا رایگان، برای همیشه
بدون آزمایش، بدون پرداخت پنهان، بدون هزینه هر فایل، بدون محدودیت کار روزانه. متن را از هر تعداد PDF که می خواهید استخراج کنید. این سرویس با تبلیغات پشتیبانی میشود، بنابراین برای همه رایگان میماند.
LLM-آماده با یک کلیک
حالت Joined را انتخاب کنید و خروجی از قبل برای چسباندن در ChatGPT، Claude، Gemini یا هر هوش مصنوعی با ورودی متن فرمت شده است. هیچ نویسهای در فید فرم که توکنها را هدر میدهد، هیچ خط عجیب و غریبی که توکنایزر را گیج میکند - فقط پاراگرافهای تمیز را انجام نمیدهد.
دسته ای چند فایلی
10، 50، 200 PDFs را یکباره رها کنید. هر یک به فایل txt خود تبدیل می شود که نام آن منبع است. ایده آل برای گردش کار تحقیقاتی، بررسی انطباق، و هر شغلی که نیاز به متن از بسیاری از اسناد به طور همزمان دارد.
فایل ها هرگز دستگاه شما را ترک نمی کنند
تمام استخراج به صورت محلی در مرورگر شما اجرا می شود. PDF های شما سرورهای ما را لمس نمی کنند زیرا ما برای فایل های شما نداریم - ما به معنای واقعی کلمه نمی توانیم اسناد شما را ببینیم.
بدون حساب، بدون ایمیل
بلافاصله استخراج را شروع کنید. بدون ثبت نام، بدون ضبط ایمیل، بدون کارت اعتباری. روشی که نرم افزار دسکتاپ قبل از "آزمایش رایگان" کار می کرد.
بدون درپوش اندازه فایل
استخراج متن محاسبات ارزانی است - بدون نیاز به محدود کردن اندازه ورودی. یک PDF 2 گیگابایتی با 10000 صفحه متن در کمتر از یک دقیقه در یک لپ تاپ معمولی.
بدون واترمارک
txt فقط حاوی آنچه در PDF بود می باشد. بدون سرصفحه «تبدیل شده با…»، بدون پیوند پاورقی، بدون نام تجاری.
آفلاین کار می کند
پس از بارگیری این صفحه، می توانید اتصال خود را از اینترنت قطع کنید و استخراج کننده همچنان کار می کند. برای PDF های محرمانه عالی است که ترجیح می دهید بدون شبکه پردازش کنید.
سه سبک خروجی، توضیح داده شد
استاندارد - پیش فرض یونیکس
Each page's text is followed by a form-feed character (\f, ASCII 12) before the next page begins. This is exactly what the command-line pdftotext utility produces — so anything downstream (Python scripts, awk pipelines, older text editors) treats the output identically. Pick this when you're replacing a pdftotext run.
پیوست - برای ورودی LLM
Every page break is removed. Pages are separated by a blank line, not a form-feed. The result is one flowing text — ideal for pasting into ChatGPT / Claude / Gemini / any LLM, because those models don't parse \f usefully and each one of those characters costs a token.
شماره گذاری شده - برای خواندن انسان
Each page is prefixed with --- Page N --- on its own line so you can navigate the .txt in a regular text editor and still see where one page ends and the next begins. Useful for reviewing extracted text manually, or attaching text alongside the original PDF for reference.
مهم: PDFs اسکن شده به OCR نیاز دارید
If your PDF is a scan — pure images of text with no embedded text layer — this converter will return nothing (or very little). We extract the text that's already in the PDF. Converting images of text to text requires OCR (optical character recognition), which needs a 2MB+ library and deserves its own dedicated tool. We're honest about that limit instead of silently running a weak OCR and returning garbage. To test: open your PDF in any viewer and try selecting text with your mouse. If text highlights, this converter will extract it. If the page highlights as one giant image, you need OCR.
PDF Edit در مقابل FreeConvert، PDF2Go، Smallpdf، pdftotext.com
| ویژگی | PDF Edit | FreeConvert | PDF2Go | Smallpdf | pdftotext.com |
|---|---|---|---|---|---|
| فایلها به سرور آپلود میشوند؟ | No — 100% local | بله | بله | بله | بله |
| دسته ای چند فایلی؟ | Unlimited | 1 در یک زمان | فقط پرداخت می شود | فقط پرداخت می شود | 1 در یک زمان |
| سبک های خروجی؟ | 3 (Standard / Joined / Numbered) | 1 | 1 | 1 | 1 |
| خروجی آماده LLM؟ | Yes (Joined) | خیر | خیر | خیر | خیر |
| نیاز به حساب کاربری؟ | Never | سطح رایگان محدود | سطح رایگان محدود | سطح رایگان محدود | خیر |
| محدودیت فایل روزانه؟ | None | 5 / ساعت | اندازه + تعداد سرپوش | 2 / ساعت | درپوش اندازه |
| واترمارک روی خروجی؟ | No | خیر | خیر | خیر | خیر |
| پس از بارگذاری به صورت آفلاین کار میکند؟ | Yes | خیر | خیر | خیر | خیر |
وقتی PDF شما حاوی هر چیزی است که ترجیح می دهید منتشر نکنید - پیش نویس ها، خلاصه های مشتری، یادداشت های داخلی، داده های تحقیقاتی - تفاوت بین فقط محلی و آپلود اول یک ویژگی راحت نیست. این کل زمین است.
چه کسی PDFs را به متن تبدیل می کند؟
تغذیه PDFs به ChatGPT / Claude
هر LLM یک ورودی متن دارد - نه ورودی PDF. با حالت Joined تبدیل کنید و txt را در دستور خود قرار دهید. توکن ها کارآمد می مانند. مدل سند شما را بدون هیچ گونه لوله کشی PDF می خواند.
تحقیق و بررسی آکادمیک
50 ژورنال PDF را به یکباره رها کنید، همه آنها را در یک دسته تبدیل کنید و grep/جستجوی متن را انجام دهید. بسیار سریعتر از Ctrl+F-ing در داخل 50 بیننده مجزا PDF.
نقل قول و استناد
بخشهای خاصی را از قراردادها، گزارشها یا مقالات برای استفاده در ایمیلها، یادداشتها یا مقالات خارج کنید. استخراج متن عبارت دقیق را حفظ می کند تا نقل قول ها دقیق بمانند.
استخراج و تجزیه و تحلیل داده ها
Financial statements, lab reports, tabular data — get the text out and feed it into spreadsheets, Python scripts, or data pipelines. Standard mode (with form-feed) cooperates nicely with awk / sed / CSV parsers.
بایگانی و فهرست بندی جستجو
بایگانی سند را به متن قابل جستجو تبدیل کنید. فایلهای txt را با ripgrep، Lunr، Meilisearch یا هر موتور جستجوی متن کامل فهرست کنید. PDF-جستجوی بومی کند است. جستجوی متن فوری است.
دسترسی و صفحه خوان
فایلهای txt تمیز در دسترسترین فرمتها هستند - هر صفحهخوانی آنها را بهطور بومی صحبت میکند، بدون موتور PDF. برای به اشتراک گذاری محتوا با خوانندگان کم بینا یا مخاطبانی که رابط های صوتی را ترجیح می دهند عالی است.
PDF به متن در هر دستگاه
مبدل PDF به متن ما روی هر دستگاهی با مرورگر مدرن کار می کند - Windows، Mac، Linux، Chromebook، iPad، iPhone، و Android. بدون نرم افزار برای نصب، بدون نیاز به پلاگین، بدون نیاز به حقوق مدیر. پس از بارگیری صفحه، می توانید اتصال خود را از اینترنت قطع کرده و استخراج را ادامه دهید - همه چیز به صورت محلی اجرا می شود.
چگونه PDF مبتنی بر مرورگر به استخراج متن کار می کند؟
Your PDF is parsed page by page inside your browser. Every text item is sorted into reading order (top-to-bottom, left-to-right, respecting columns when possible) and serialised as UTF-8 plain text. Page breaks are inserted as form-feed characters (Standard mode), removed entirely (Joined mode), or replaced with --- Page N --- headers (Numbered mode). No server involved at any step — your PDF stays in device memory the whole time.
سوالات متداول
چگونه یک PDF را به صورت رایگان به متن تبدیل کنم؟
PDF(های) خود را در صفحه بالا رها کنید، یک سبک خروجی انتخاب کنید، روی Convert to Text کلیک کنید. هر PDF به فایل txt خود تبدیل می شود که به صورت محلی دانلود می شود.
کدام سبک خروجی برای ChatGPT / Claude / LLM بهترین است؟
پیوست. شکستگیهای صفحه (که توکنها را هدر میدهند) را حذف میکند و متن روان و تمیزی تولید میکند که مدل میتواند آن را به عنوان پاراگرافهای طبیعی بخواند.
آیا PDF من روی سرور آپلود می شود؟
خیر. Extraction به طور کامل در مرورگر شما اجرا می شود. PDF شما هرگز سرورهای ما را لمس نمی کند - ما برای فایل های شما نداریم.
آیا می توانم یک PDF اسکن شده را به متن تبدیل کنم؟
نه با این ابزار لایه متن تعبیه شده در PDF را استخراج می کنیم. اسکن ها (تصاویر متن بدون لایه متنی) به OCR نیاز دارند که یک کتابخانه جداگانه است و شایسته ابزار خاص خود است. برای آزمایش: متن را در نمایشگر PDF خود انتخاب کنید - اگر متن برجسته شد، آن را استخراج می کنیم. اگر صفحه به عنوان یک تصویر برجسته می شود، به OCR نیاز دارید.
آیا می توانم چندین PDF را همزمان تبدیل کنم؟
بله هر تعداد که می خواهید رها کنید. هر کدام به فایل txt. خود در صفحه آماده تبدیل می شوند — بدون ZIP، بدون بایگانی، فقط دانلودهای جداگانه.
آیا متن طرح بندی را حفظ می کند؟
تقریباً بله — ترتیب خواندن، شکستهای خط و ساختار ستون حفظ میشوند وقتی PDF یک لایه متنی مناسب داشته باشد. طرحبندیهای پیچیده (مجلات دوستونه، جداول سنگین) گاهی بهطور عجیبی درهم میروند. برای وفاداری کامل طرحبندی از /pdf-to-word.html استفاده کنید.
آیا محدودیت حجم فایل وجود دارد؟
بدون محدودیت مصنوعی استخراج متن ارزان است - حتی یک PDF 2 گیگابایتی با دهها هزار صفحه معمولاً در کمتر از یک دقیقه در یک لپتاپ مدرن تمام میشود.
آیا .txt واترمارک یا انتساب دارد؟
نه. فقط متن از PDF شما، چیزی اضافه نشده است. بدون سرصفحه، بدون پیوند پاورقی، بدون خط "تبدیل شده با ...".
آیا به یک حساب کاربری نیاز دارم؟
نه. بدون ثبت نام، بدون ایمیل، بدون کپچا، بدون کارت اعتباری.
آفلاین کار میکنه؟
بله، پس از بارگذاری صفحه. همه چیز در مرورگر شما اجرا می شود - اتصال را قطع کنید و به استخراج ادامه دهید.
Last updated: