Natural Languange Processing (Pemroses Bahasa Alami)
kali ini saya akan menulis blog yang berisi rangkuman materi pertemuan 10 tentang Natural language processing yang terdiri dari :
1. Apa itu Natural language processing
2. Pendekatan Natural language processing
3. Teknik dalam Natural language processing
4. Masalah di Natural language processing
5. Pembagian Natural language processing
6. Tahapan Proses Natural language processing
1. Apa itu Natural language processing
Natural
language processing (NLP) adalah cabang dari kecerdasan buatan yang berhubungan
dengan interaksi antara komputer dan manusia menggunakan bahasa alami yang
dapat mengartikan suatu bahasa baik bahasa tulisan maupun bahasa lisan atau
memproses masukan yang berupa bahasa menjadi suatu informasi atau pengetahuan
2. Pendekatan Natural language processing
- Pendekatan simbolik
Pendekatan simbolik menggunakan pendekatan yang berdasarkan pada aturan dan leksikon yang dikembangkan manusia.Pendekatan statistik
- Pendekatan statistik
Didasarkan pada contoh fenomena linguistik yang dapat diamati dan
berulang. Sistem mengenali tema berulang melalui analisis matematis.
- Pendekatan koneksi
Pendekatan
koneksi merupakan pendekatan yang menggabungkan pendekatan simbolik dan
pendekatan statistik.
3. Teknik dalam Natural language processing
- Syntax
Syntax
mengacu pada susunan kata-kata dalam sebuah kalimat sehingga tampak masuk akal
secara tata bahasa. NLP menggunakan analisis syntax untuk menerapkan aturan
tata bahasa pada kumpulan kata yang ditemukannya.
Ada
beberapa teknik syntax yang bisa digunakan.
- Lemmatization, melakukan pengurangan berbagai bentuk kata yang berubah menjadi satu bentuk untuk memudahkan analisis.
- Segmentasi morfologis, melibatkan pembagian kata menjadi unit-unit individu atau morfem.
- Segmentasi kata, membagi sebagian besar teks berkelanjutan menjadi unit-unit berbeda.
Semantics
mengacu pada makna yang disampaikan oleh sebuah teks. Ini merupakan aspek yang
paling sulit dianalisis dalam natural language processing dan belum sepenuhnya
dipelajari. Analisis ini melibatkan penerapan algoritma komputer untuk memahami
arti dan interpretasi kata-kata dan bagaimana kalimat disusun.
Berikut
beberapa teknik semantics yang umum digunakan dalam NLP :
- Named entity recognition (NER), melibatkan penentuan bagian-bagian teks yang dapat diidentifikasi dan dikategorikan ke dalam grup tertentu. Contohnya nama orang dan nama tempat.
- Disambiguasi arti kata, melibatkan pemberian makna pada kata berdasarkan konteksnya.
- Natural language generation, melibatkan penggunaan database untuk mendapatkan maksud semantik dari teks dan mengubahnya menjadi bahasa manusia.
4. Masalah di Natural language processing
Beberapa masalah yang
dihadapi dalam pemrosesan bahasa alami antara lain adalah :
- Suatu kalimat sering kali tidak lengkap, artinya tidak memberi informasi yang jelas atau lengkap
- Satu kalimat dapat memiliki lebih dari satu pengertian dalam konteks yang berbeda
- Tidak ada program pemroses bahasa alami yang cukup lengkap karena bahasa selalu berkembang, kosa kata selalu bertambah.
- Bisa terdapat lebih dari satu cara (lebih dari satu kalimat) untuk mengungkapkan hal (maksud) yang sama
5. Pembagian Natural language processing
Masalah
pemrosesan bahasa alami dibagi menjadi dua bagian besar, yaitu :
menggunkan pengetahuan tentang leksikal, sintax, dan semantik
menggunakan semua pengetahuan dari pemrosesan naskah
tertulis ditambah pengetahuan tentang phonology.
6. Tahapan Proses Natural language processing
1. Morphological level
Morfem adalah unit makna terkecil dari sebuah kata. Level
ini berkaitan dengan morfem dalam perannya sebagai bagian yang menyusun kata.\
1. Morphological level
Morfem adalah unit makna terkecil dari sebuah kata. Level
ini berkaitan dengan morfem dalam perannya sebagai bagian yang menyusun kata.
2. Lexical level
Pada level ini, sistem akan fokus pada bagaimana
bagian-bagian kata (morfem) bergabung untuk membuat kata-kata. Kemudian, sistem
akan mengidentifikasi perbedaan-perbedaan untuk menemukan arti dari setiap
kata.
3. Syntactic level
Level ini berfokus pada teks di level kalimat. Tahap ini
berkisar pada gagasan bahwa dalam kebanyakan bahasa, arti kalimat bergantung
pada urutan kata dan tata bahasanya.
4. Semantic level
Pada level ini, sistem berfokus pada bagaimana konteks kata
dalam kalimat membantu menentukan arti kata pada tingkat individu.
5. Discourse level
Level ini berfokus pada bagaimana kalimat berhubungan satu
sama lain dalam satu teks. Sistem akan mengidentifikasi urutan dan pengaturan
kalimat yang dapat mempengaruhi arti kalimat.
6. Pragmatic level
Level ini berfokus pada makna kata atau kalimat pada
kesadaran situasional dan pengetahuan dunia. Pada dasarnya, sistem akan
mengidentifikasi apa arti yang paling mungkin dan paling masuk akal dari teks
tersebut.


Komentar
Posting Komentar