What is Tokenization | Tokenization in NLP | Python - Tokenization - Part 2
In Python tokenization basically refers to splitting up a larger body of text into smaller lines, words or even creating words for a non-English language. The various tokenization functions in-built into the nltk module itself and can be used in programs as shown below.
Line Tokenization
In the below example we divide a given text into different lines by using the function sent_tokenize.
import nltk
sentence_data = "The First sentence is about Python. The Second: about Django. You can learn Python,Django and Data Ananlysis here. "
nltk_tokens = nltk.sent_tokenize(sentence_data)
print (nltk_tokens)
When we run the above program, we get the following output −
['The First sentence is about Python.', 'The Second: about Django.', 'You can learn Python,Django and Data Ananlysis here.']
Non-English Tokenization
In the below example we tokenize the German text.
import nltk
german_tokenizer = nltk.data.load('tokenizers/punkt/german.pickle')
german_tokens=german_tokenizer.tokenize('Wie geht es Ihnen? Gut, danke.')
print(german_tokens)
When we run the above program, we get the following output −
['Wie geht es Ihnen?', 'Gut, danke.']
Word Tokenzitaion
We tokenize the words using word_tokenize function available as part of nltk.
import nltk
word_data = "It originated from the idea that there are readers who prefer learning new skills from the comforts of their drawing rooms"
nltk_tokens = nltk.word_tokenize(word_data)
print (nltk_tokens)
When we run the above program we get the following output −
['It', 'originated', 'from', 'the', 'idea', 'that', 'there', 'are', 'readers',
'who', 'prefer', 'learning', 'new', 'skills', 'from', 'the',
'comforts', 'of', 'their', 'drawing', 'rooms']
#nlp , #tokenization , #python , #nlptutorial
#pythonnaturallanguageprocessing
#stanfordnaturallanguageprocessing
#whatisnaturallanguageprocessing
#naturallanguageprocessingwithdeeplearning
#naturallanguageprocessinginartificialintelligence
#naturallanguageprocessing nptel
#danjurafsky&chrismanningnaturallanguageprocessing
#deeplearningfornaturallanguageprocessing
#naturallanguageprocessing
#naturallanguageprocessinginartificialintelligence
#naturallanguageprocessingtutorial
#naturallanguageprocessingpython
#naturallanguageprocessingnptel
#naturallanguageprocessingtrainingvideos
#naturallanguageprocessingstanford
#whatisnaturallanguageprocessing
#deeplearningfornaturallanguageprocessing
#semanticanalysisinnaturallanguageprocessing
#naturallanguageprocessinglectures
#nptelnaturallanguageprocessing
#naturallanguageprocessinginartificialintelligenceinhindi
#naturallanguageprocessingusingpython
#naturallanguageprocessing
#naturallanguageprocessinginpython
#naturallanguageprocessingstanford
#naturallanguageprocessingtutorial
#natural_language_processing_tutorial
#python_natural_language_processing
#stanford_natural_language_processing
#whatisnaturallanguageprocessing
#natural_language_processing_with_deep_learning
#naturallanguageprocessinginartificialintelligence
#natural_language_processing nptel
#danjurafsky&chrismanningnaturallanguageprocessing
#deep_learning_for_natural_language_processing
#natural_language_processing
#natural_language_processing_in_artificial_intelligence
#natural_language_processing_tutorial
#natural_language_processing_python
#natural_language_processing_nptel
#natural_language_processing_training_videos
#natural_language_processing_stanford
#what_is_natural_language_processing
#deep_learning_for_natural_language_processing
#semantic_analysis_in_natural_language_processing
#natural_language_processing_lectures
#nptel_natural_language_processing
#natural_language_processing_in_artificial_intelligence_in_hindi
#natural_language_processing_using_python
#pythonnaturallanguageprocessing
#stanfordnaturallanguageprocessing
#whatisnaturallanguageprocessing
#naturallanguageprocessingwithdeeplearning
#naturallanguageprocessinginartificialintelligence
#naturallanguageprocessingnptel
#danjurafsky&chrismanningnaturallanguageprocessing
#deeplearningfornaturallanguageprocessing
#naturallanguageprocessing
#naturallanguageprocessinginartificialintelligence
#naturallanguageprocessingtutorial
#naturallanguageprocessingpython
#naturallanguageprocessingnptel
#naturallanguageprocessingtrainingvideos
#naturallanguageprocessingstanford
#whatisnaturallanguageprocessing
#deeplearningfornaturallanguageprocessing
#semanticanalysisinnaturallanguageprocessing
#naturallanguageprocessinglectures
#nptelnaturallanguageprocessing
#naturallanguageprocessinginartificialintelligenceinhindi
#naturallanguageprocessingusingpython
Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «What is Tokenization | Tokenization in NLP | Python - Tokenization - Part 2», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.
Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.
Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!
Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.