পিডিএফ এবং ইমেজ ফাইল থেকে টেক্সট নিষ্কাশন


কি একটি পিডিএফ ডকুমেন্ট আছে যা আপনি সব পাঠ্য খুঁজে বের করতে চান? একটি স্ক্যানড দস্তাবেজের ইমেজ ফাইলগুলি সম্পর্কে আপনি কীভাবে সম্পাদনাযোগ্য পাঠ্য রূপান্তর করতে চান? ফাইলগুলির সাথে কাজ করার সময় এই কর্মক্ষেত্রে আমি যেসব সাধারণ বিষয় দেখেছি, সেগুলির মধ্যে এটি হল কিছু।

এই প্রবন্ধে, আমি পিডিএফ থেকে পাঠ্য প্রক্রিয়াকরণের চেষ্টা করার ব্যাপারে বিভিন্ন উপায় সম্পর্কে কথা বলতে পারি বা একটি ছবি থেকে আপনার নিষ্কাশন ফলাফল পিডিএফ বা ইমেজ টেক্সট টাইপ এবং মানের উপর নির্ভর করে পরিবর্তিত হতে পারে। এছাড়াও, আপনার ফলাফল আপনি ব্যবহার টুল উপর নির্ভর করে পরিবর্তিত হতে পারে, তাই শ্রেষ্ঠ ফলাফল পেতে সম্ভাব্য নীচের হিসাবে অনেক অপশন চেষ্টা হিসাবে ভাল।

চিত্র বা পিডিএফ থেকে টেক্সট নিষ্কাশন

শুরু করার সহজতম এবং দ্রুততম উপায় হল একটি অনলাইন পিডিএফ পাঠ্য বিদারণকারী পরিষেবা। এটি সাধারণত বিনামূল্যে এবং আপনি আপনার কম্পিউটারে কিছু ইনস্টল না করে আপনি খুঁজছেন কি ঠিক করতে পারেন।

ExtractPDF

extractpdf

ExtractPDF একটি পিডিএফ ফাইল থেকে ছবি, পাঠ্য এবং ফন্ট বের করার জন্য একটি বিনামূল্যের সরঞ্জাম। শুধুমাত্র সীমাবদ্ধতা হলো পিডিএফ ফাইলের সর্বাধিক আকার 10 এমবি। এটা একটু ছোট; তাই আপনি যদি একটি বড় ফাইল আছে, নীচের অন্যান্য পদ্ধতি কিছু চেষ্টা করুন আপনার ফাইলটি নির্বাচন করুন এবং তারপর ফাইল প্রেরণ করুনবোতামে ক্লিক করুন ফলাফলগুলি সাধারণত খুব দ্রুত হয় এবং আপনি টেক্সট ট্যাবের উপর ক্লিক করলে আপনি টেক্সটির একটি পূর্বরূপ দেখতে পাবেন।

download text

এটি একটি চমৎকার যোগ করা বেনিফিট যে এটি পিডিএফ ফাইলের বাইরে ছবিগুলিও বের করে দেয়, ঠিক তখনই আপনার প্রয়োজন! সামগ্রিকভাবে, অনলাইন টুলটি দুর্দান্ত কাজ করে, কিন্তু আমি কয়েকটি পিডিএফ ডক্সের মধ্যে রান করেছি যা আমাকে মজার আউটপুট দেয়। টেক্সট ঠিক জরিমানা করা হয়, কিন্তু কিছু কারণে এটি প্রতিটি শব্দ পরে একটি লাইন বিরতি থাকবে! একটি ছোট পিডিএফ ফাইলের জন্য কোন বড় সমস্যা নয়, তবে প্রচুর টেক্সট দিয়ে ফাইলগুলির জন্য অবশ্যই একটি সমস্যা। যদি এমন হয় তবে পরবর্তী টুলটি চেষ্টা করুন।

অনলাইন OCR

অনলাইন ওসিআর সাধারণত ডিস্ট্রিবিউশন পিডিএফ , তাই এটি আপনাকে ভাল আউটপুট দেয় যা দেখতে উভয় পরিষেবা চেষ্টা একটি ভাল ধারণা। অনলাইন ওসিআর এর কিছু চমৎকার বৈশিষ্ট্য রয়েছে যেগুলি বড় পিডিএফ ফাইলের জন্য যে কেউ সহজেই প্রমাণ করতে পারে যে শুধুমাত্র পুরো নথির পরিবর্তে কয়েকটি পৃষ্ঠায় পাঠ্য পরিবর্তনের প্রয়োজন।

আপনি যা করতে চান তা প্রথম এগিয়ে এবং একটি বিনামূল্যে অ্যাকাউন্ট তৈরি করুন এটি একটি বিট বিরক্তিকর, কিন্তু যদি আপনি বিনামূল্যে অ্যাকাউন্ট তৈরি করেন না, এটি শুধুমাত্র সম্পূর্ণভাবে আপনার নথির পরিবর্তে আপনার পিডিএফ রূপান্তর করবে। এছাড়াও, শুধুমাত্র একটি 5 মেগাবাইট ডকুমেন্ট আপলোড করার পরিবর্তে, আপনি একাউন্টের মাধ্যমে প্রতিটি ফাইলের 100MB পর্যন্ত আপলোড করতে পারেন।

online ocr

প্রথম , একটি ভাষা নির্বাচন করুন এবং তারপর রূপান্তরিত ফাইলের জন্য আপনি চান আউটপুট ফরম্যাট টাইপ চয়ন। আপনার কাছে কয়েকটি বিকল্প আছে এবং আপনি যদি পছন্দ করেন তবে আপনি একাধিক চয়ন করতে পারেন। মাল্টিপায়েজ ডকুমেন্টএর অধীনে, আপনি পৃষ্ঠা সংখ্যানির্বাচন করতে পারেন এবং তারপর কেবলমাত্র যে পৃষ্ঠাগুলি আপনি রূপান্তর করতে চান তা চয়ন করুন। তারপর আপনি ফাইলটি নির্বাচন করুন এবং রূপান্তরক্লিক করুন!

online ocr docs

রূপান্তরের পরে, আপনাকে ডকুমেন্টস বিভাগে নিয়ে যাওয়া হবে (যদি আপনি লগ ইন হন) যেখানে আপনি দেখতে পান যে আপনি কতগুলি মুক্ত পৃষ্ঠাগুলি রেখেছেন এবং আপনার রূপান্তরিত ফাইল ডাউনলোড লিঙ্ক। মনে হচ্ছে আপনার কাছে শুধুমাত্র 25 টি পৃষ্ঠা বিনামূল্যে আছে, তাই আপনার যদি এর চেয়ে বেশি প্রয়োজন হয়, তবে আপনাকে কিছুটা অপেক্ষা করতে হবে অথবা আরো পৃষ্ঠাগুলি কিনতে হবে।

অনলাইন ওসিআর রূপান্তর করার একটি চমৎকার কাজ করেছেন আমার পিডিএফ কারণ এটি পাঠ্যের প্রকৃত লেআউট বজায় রাখতে সক্ষম ছিল। আমার পরীক্ষায় আমি একটি Word ডক করেছি যা বুলেটগুলি, বিভিন্ন ফন্টের আকার ইত্যাদি ব্যবহার করেছে এবং এটি একটি পিডিএফ রূপে রূপান্তরিত করেছে। তারপর আমি এটি শব্দ ফরম্যাটে ফিরে রূপান্তর জন্য অনলাইন ওসিআর ব্যবহৃত এবং এটি সম্পর্কে প্রায় 95% মূল হিসাবে একই ছিল।

প্লাস, আপনি যদি কোনও চিত্রকে টেক্সটতে রূপান্তরিত করতে চান, তাহলে অনলাইন ওসিআর সহজেই পিডিএফ ফাইলগুলি থেকে টেক্সটটি বের করতে পারেন।

ফ্রি অনলাইন ওসিআর

যেহেতু চিত্রটি OCR পাঠাতে চিত্র সম্পর্কে কথা বলছে, আমাকে আরেকটি ভাল ওয়েবসাইট উল্লেখ করুন যা ইমেজগুলিতে সত্যিই ভাল কাজ করে। আমার টেস্ট ইমেজ থেকে টেক্সট নিষ্কাশন যখন <6><6>খুব ভাল এবং খুব সঠিক ছিল। আমি বই, পামফলেট, ইত্যাদি থেকে আমার আইফোন পেজ থেকে কয়েকটি ছবি তুলেছি এবং আমি এটিতে রূপান্তর করতে সক্ষম কতটুকু বিস্মিত হয়েছিলাম।

free online ocr

আপনার ফাইলটি নির্বাচন করুন এবং তারপর আপলোড বোতামটি ক্লিক করুন। পরবর্তী স্ক্রিনে, কয়েকটি বিকল্প এবং চিত্রটির একটি পূর্বরূপ রয়েছে। যদি আপনি পুরো বিষয়টি OCR করতে না চান তবে আপনি এটি ফসল করতে পারেন। তারপর শুধু ওসিআর বোতামটি ক্লিক করুন এবং আপনার রূপান্তরিত পাঠ্য চিত্র পূর্বরূপের নীচে প্রদর্শিত হবে। এটি কোনও সীমাবদ্ধতা নেই, যা সত্যিই চমৎকার।

অনলাইন পরিষেবাগুলি ছাড়াও, দুটি বিনামূল্যের পিডিএফ কনভার্টার আছে যা আপনি আপনার কম্পিউটারে স্থানীয়ভাবে চলমান সফ্টওয়্যারের প্রয়োজনে উল্লেখ করতে চান রূপান্তরগুলি। অনলাইনে পরিষেবাগুলির সাথে, আপনাকে সর্বদা ইন্টারনেট সংযোগের প্রয়োজন হবে এবং এটি সকলের পক্ষে সম্ভব হবে না। যাইহোক, আমি লক্ষ্য করেছি যে বিনামূল্যের অনুষ্ঠানগুলি থেকে কথোপকথনগুলির মানগুলি ওয়েবসাইটগুলির চেয়ে উল্লেখযোগ্যভাবে খারাপ।

এ-পিডিএফ টেক্সট এক্সট্র্যাক্টর

A- পিডিএফ টেক্সট এক্সট্র্যাক্টর বিনামূল্যের যে পিডিএফ ফাইল থেকে টেক্সট নিষ্কাশন একটি মোটামুটি ভাল কাজ করে একবার এটি ডাউনলোড করে ইনস্টল করুন, আপনার পিডিএফ ফাইলটি নির্বাচন করার জন্য ওপেন বোতামটি ক্লিক করুন। তারপর প্রারম্ভ শুরু করতে টেক্সট এক্সট্র্যাক্ট করুন ক্লিক করুন।

apdf extractor

এটি আপনাকে পাঠ্য আউটপুট ফাইল সংরক্ষণের জন্য একটি অবস্থান জিজ্ঞাসা করবে এবং তারপর এটি বের করা শুরু করবে । আপনি বিকল্পবোতামে ক্লিক করতে পারেন, যা আপনাকে কেবল নির্দিষ্ট পৃষ্ঠাগুলি এবং নিষ্কাশন প্রকার নির্বাচন করতে দেয়। দ্বিতীয় বিকল্পটি আকর্ষণীয় কারণ এটি বিভিন্ন লেআউটের পাঠ্যটি ছাঁটাই করে এবং তিনটি চেষ্টা করার চেষ্টা করা হয় যা আপনাকে সেরা আউটপুট দেয়।

PDF2Text পাইলট

PDF2Text পাইলট পাঠ্য এক্সট্র্যাক্ট করার একটি সঠিক কাজ করে। এটি কোন বিকল্প নেই; আপনি শুধু ফাইল বা ফোল্ডার যোগ করুন, রূপান্তর এবং সেরা জন্য আশা করি। এটি কিছু পিডিএফ নেভিগেশন ভাল কাজ করে, কিন্তু তাদের অধিকাংশ জন্য, অনেক সমস্যা ছিল।

pdf2text

শুধু ফাইল ক্লিক করুন এবং তারপর ক্লিক করুন রূপান্তর করুন। একবার রূপান্তরটি সম্পন্ন হলে ফাইলটি খুলতে ব্রাউজ এ ক্লিক করুন। আপনি এই প্রোগ্রাম ব্যবহার করে মাইলেজ পরিবর্তিত হবে তাই অনেক আশা করবেন না।

এছাড়াও, এটি উল্লেখযোগ্য যে আপনি যদি কর্পোরেট পরিবেশে থাকেন বা আপনার কাজ অ্যাডোবি অ্যাক্রোব্যাটের অনুলিপিতে আপনার হাত পেতে পারেন তবে আপনি সত্যিই অনেক ভালো ফলাফল পেতে পারেন। অ্যাক্রোব্যাট স্পষ্টতই মুক্ত নয়, তবে ওয়ার্ড, এক্সেল এবং এইচটিএমএল বিন্যাসে পিডিএফ রূপান্তর করার বিকল্প রয়েছে। এটি মূল নথির গঠন বজায় রাখার এবং জটিল পাঠ্য রূপান্তর করার সর্বোত্তম কাজ করে।

Week 8

সম্পর্কিত পোস্ট:


13.11.2014