Natural Languange Processing (Pemroses Bahasa Alami)

 

kali ini saya akan menulis blog yang berisi rangkuman materi pertemuan 10 tentang Natural language processing yang terdiri dari : 

1. Apa itu Natural language processing 

2. Pendekatan Natural language processing 

3. Teknik dalam Natural language processing

4. Masalah di Natural language processing 

5. Pembagian Natural language processing 

6. Tahapan Proses Natural language processing



1.    Apa itu Natural language processing

Natural language processing (NLP) adalah cabang dari kecerdasan buatan yang berhubungan dengan interaksi antara komputer dan manusia menggunakan bahasa alami yang dapat mengartikan suatu bahasa baik bahasa tulisan maupun bahasa lisan atau memproses masukan yang berupa bahasa menjadi suatu informasi atau pengetahuan


 2.    Pendekatan Natural language processing

  • Pendekatan simbolik

Pendekatan simbolik menggunakan pendekatan yang berdasarkan pada aturan dan leksikon yang dikembangkan manusia.Pendekatan statistik

  • Pendekatan statistik

Didasarkan pada contoh fenomena linguistik yang dapat diamati dan berulang. Sistem mengenali tema berulang melalui analisis matematis.

  • Pendekatan koneksi

Pendekatan koneksi merupakan pendekatan yang menggabungkan pendekatan simbolik dan pendekatan statistik.

 

3.    Teknik dalam Natural language processing

  1. Syntax

Syntax mengacu pada susunan kata-kata dalam sebuah kalimat sehingga tampak masuk akal secara tata bahasa. NLP menggunakan analisis syntax untuk menerapkan aturan tata bahasa pada kumpulan kata yang ditemukannya.

Ada beberapa teknik syntax yang bisa digunakan.

  • Lemmatization, melakukan pengurangan berbagai bentuk kata yang berubah menjadi satu bentuk untuk memudahkan analisis.
  • Segmentasi morfologis, melibatkan pembagian kata menjadi unit-unit individu atau morfem.
  • Segmentasi kata, membagi sebagian besar teks berkelanjutan menjadi unit-unit berbeda.

     2. Semantics

Semantics mengacu pada makna yang disampaikan oleh sebuah teks. Ini merupakan aspek yang paling sulit dianalisis dalam natural language processing dan belum sepenuhnya dipelajari. Analisis ini melibatkan penerapan algoritma komputer untuk memahami arti dan interpretasi kata-kata dan bagaimana kalimat disusun.

Berikut beberapa teknik semantics yang umum digunakan dalam NLP :

  • Named entity recognition (NER), melibatkan penentuan bagian-bagian teks yang dapat diidentifikasi dan dikategorikan ke dalam grup tertentu. Contohnya nama orang dan nama tempat.
  • Disambiguasi arti kata, melibatkan pemberian makna pada kata berdasarkan konteksnya.
  • Natural language generation, melibatkan penggunaan database untuk mendapatkan maksud semantik dari teks dan mengubahnya menjadi bahasa manusia.

 4.    Masalah di Natural language processing

Beberapa masalah yang dihadapi dalam pemrosesan bahasa alami antara lain adalah :

  1. Suatu kalimat sering kali tidak lengkap, artinya tidak memberi informasi yang jelas atau lengkap
  2. Satu kalimat dapat memiliki lebih dari satu pengertian dalam konteks yang berbeda
  3. Tidak ada program pemroses bahasa alami yang cukup lengkap karena bahasa selalu berkembang, kosa kata selalu bertambah.
  4. Bisa terdapat lebih dari satu cara (lebih dari satu kalimat) untuk mengungkapkan hal (maksud) yang sama

  

5.    Pembagian Natural language processing

Masalah pemrosesan bahasa alami dibagi menjadi dua bagian besar, yaitu :

1. Pemrosesan Naskah Tertulis

menggunkan pengetahuan tentang leksikal, sintax, dan semantik

2. Pemrosesan Bahasa Lisan

menggunakan semua pengetahuan dari pemrosesan naskah tertulis ditambah pengetahuan tentang phonology.




6. Tahapan Proses Natural language processing

1. Morphological level

Morfem adalah unit makna terkecil dari sebuah kata. Level ini berkaitan dengan morfem dalam perannya sebagai bagian yang menyusun kata.\

1. Morphological level

Morfem adalah unit makna terkecil dari sebuah kata. Level ini berkaitan dengan morfem dalam perannya sebagai bagian yang menyusun kata.

2. Lexical level

Pada level ini, sistem akan fokus pada bagaimana bagian-bagian kata (morfem) bergabung untuk membuat kata-kata. Kemudian, sistem akan mengidentifikasi perbedaan-perbedaan untuk menemukan arti dari setiap kata.

3. Syntactic level

Level ini berfokus pada teks di level kalimat. Tahap ini berkisar pada gagasan bahwa dalam kebanyakan bahasa, arti kalimat bergantung pada urutan kata dan tata bahasanya.

4. Semantic level

Pada level ini, sistem berfokus pada bagaimana konteks kata dalam kalimat membantu menentukan arti kata pada tingkat individu.

5. Discourse level

Level ini berfokus pada bagaimana kalimat berhubungan satu sama lain dalam satu teks. Sistem akan mengidentifikasi urutan dan pengaturan kalimat yang dapat mempengaruhi arti kalimat.

6. Pragmatic level

Level ini berfokus pada makna kata atau kalimat pada kesadaran situasional dan pengetahuan dunia. Pada dasarnya, sistem akan mengidentifikasi apa arti yang paling mungkin dan paling masuk akal dari teks tersebut.

 


Komentar

Postingan populer dari blog ini

Algorithma Klipping (Clipping)

OpenGL & GLUT

SYNTHETIC CAMERA