RUVIDEO
Поделитесь видео 🙏

Extract Text from PDF with Python

In this video we learn how to extract text from a PDF file with Python using PyPDF2. We also learn how to convert PDF to a text file. We start off with a simple example of extracting text from a single page. We then extract the text from all the pages in the pdf. After this we use an example of getting text from pages that meet a certain condition (i.e., containing the word Waldo). With this example we learn how to extract text from multiple PDF pages that we specified. Next we write those extracted PDF Pages to a new PDF document. Finally we extract only the sentences that contain Waldo and the pages that those sentences were located on.

This is based on a real project I did for work where I had to extract pertinent information about specific people from thousands of PDFs that contained many pages each.

►►GitHub: https://github.com/bvalgard/working-with-existing-pdfs
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
$15 off Annual Dataquest subscription
app.dataquest.io/referral-signup/qybqz3r8/
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

My Number 1 course recommendation for self learners (affiliate link): bit.ly/GoogleAnalyticsProfessionalCertificate

Udemy Recommendations that I have Personally Taken (affiliate links):
►►Learn Statistics http://bit.ly/Statistics4DSUdemyCE
►►Learn Python http://bit.ly/LearnPythonCE
►►Learn SQL http://bit.ly/LearnSQLCE
►►Learn Data Analysis (this goes into advanced concepts - learn up to and including Logistic regression - you don't need this before you start applying for jobs but it can help) http://bit.ly/PythonMLDS_CE
►►Learn Business Intelligence http://bit.ly/LearnBI_CE
►►Learn Time Series Analysis (this is an important skill in SOME jobs, but you don't need this before you start applying for jobs) http://bit.ly/TimeSeries_CE

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

More or my videos You may be interested in
►►Create PDF with Pyhton | Part 1 https://youtu.be/q70xzDG6nls

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

Merch: https://bit.ly/PythonAndDataMerch

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

Consider subscribing for weekly tips, tricks, and tutorials. https://www.youtube.com/channel/UC17QKsysOmZ7oJepmmcUTvA?sub_confirmation=1

Join my Discord Server https://discord.gg/EEajBNpeK9

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

References
https://realpython.com/creating-modifying-pdf/#using-the-pdffilewriter-class

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

0:00 Intro - Where's Waldo
0:36 pip install
0:59 Extract Text
1:20 Step 1
2:09 Step 2
2:58 All Pages to txt
4:20 Where's Waldo Pages
5:51 Write to PDF
6:21 Get Text from Specific Pages
8:15 Waldo Sentences

Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «Extract Text from PDF with Python», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.

Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.

Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!

Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.