SNOBOL: Ketahui Mengenai Bahasa Pemprosesan Teks Ini dari tahun 60-an

Pendedahan: Sokongan anda membantu mengekalkan laman web ini! Kami memperoleh bayaran rujukan untuk beberapa perkhidmatan yang kami cadangkan di halaman ini.


SNOBOL – Bahasa Berorientasikan StriNg dan symBOlic – adalah keluarga bahasa pengaturcaraan yang pada mulanya dikembangkan pada pertengahan 1960-an, terutamanya untuk tujuan pemprosesan teks dan analisis rentetan.

Nota Pantas Mengenai Versi dan Pelaksanaan

Keluaran terakhir SNOBOL yang stabil oleh pembangun asal ialah SNOBOL4, pada tahun 1967. Anda akan melihat kedua-dua buku dan laman web menggunakan “SNOBOL” dan “SNOBOL4” (dan kadang-kadang “Snobol”). Mengenai apa sahaja selepas tahun 1967, semuanya merujuk kepada versi bahasa yang sama (akhir).

Terdapat juga sejumlah ekstensi dan implementasi. Snocone adalah preprocessor bahasa yang memberikan gula sintaksis kepada bahasa, menjadikannya lebih mudah digunakan. SPITBOL adalah penyusun untuk SNOBOL; ini menarik perhatian kerana pada asalnya dianggap bahawa SNOBOL tidak dapat digunakan. Terdapat juga bahasa pengaturcaraan Snowball, yang diilhami oleh dan dinamai SNOBOL.

Kerana peluasan ini dan lain-lain, sebilangan orang menggunakan frasa “Vanilla SNOBOL” ketika merujuk kepada kod yang hanya menerapkan spesifikasi SNOBOL4 yang asli, dan bukan ciri tambahan.

Mengenai Bahasa

SNOBOL dibuat khusus untuk manipulasi teks dan rentetan. Oleh kerana itu, ia mempunyai ciri yang agak unik: corak dianggap sebagai jenis data kelas pertama. Ini membolehkan corak diri mereka dimanipulasi, seperti struktur data lain. Selain itu, tali boleh dianggap sebagai kod dan dinilai. Ini membolehkan penggunaan corak berulang dan pemprosesan dan analisis rentetan yang sangat kompleks. Program SNOBOL bahkan boleh mengubah kod sumbernya sendiri.

Corak dalam SNOBOL boleh menjadi sederhana, seperti jangka pendek teks atau rentetan jenis watak seperti regex. Tetapi mereka juga sangat rumit, seperti deskripsi formal mengenai tatabahasa bahasa. Penafsir bahasa pengaturcaraan boleh ditulis dalam SNOBOL, serta analisis tatabahasa bahasa semula jadi, pemeriksaan ejaan, dan (secara teori) mesin terjemahan.

SNOBOL sangat popular di akademik Sains Komputer pada tahun 1960-an dan 70-an, dan digunakan secara meluas dalam bidang kemanusiaan hingga tahun 1980-an. Ini sebahagian besarnya tidak lagi digunakan pada masa ini, untuk mendukung pengaturcaraan Ekspresi Biasa yang kurang kuat menggunakan bahasa seperti Awk dan Perl. Masih ada segelintir pembangun SNOBOL yang setia di luar sana, dan bahasanya berpotensi untuk menjadi berguna seperti biasa.

Tutorial Dalam Talian

  • Tutorial Snobol4, tutorial dari 1985 oleh Mark Emmer;
  • Emmer juga menulis Vanilla Snobol4: Manual Tutorial dan Rujukan (PDF) dan Macro SPITBOL: The High Performance SNOBOL4 Language (PDF);
  • Menggunakan SNOBOL / SITBOL di TWENEX.ORG, tutorial ini adalah untuk pelaksanaan SITBOL SNOBOL, untuk digunakan pada sistem TOPS-20 Akses Awam SDF – terdapat beberapa petunjuk platform yang aneh di sini, tetapi juga tutorial yang baik mengenai SNOBOL itu sendiri;
  • SNOBOL4 Powerpoint Presentation, ini hanya memberikan slaid dari pembentangan mengenai SNOBOL – bukan pengenalan tersendiri yang hebat, tetapi perlu untuk melihat gambaran keseluruhan mengenai konsep utama;
  • Menggunakan SNOBOL di MTS, panduan untuk menggunakan bahasa pada sistem Terminal Michigan kerangka utama – ini boleh berguna, bersama dengan emulator Hercules, jika anda perlu mengerjakan sistem SNOBOL yang lama.

Alat

  • SPITBOL, pelaksanaan SNOBOL yang disusun, terdapat di Github;
  • SnoPy, perpustakaan Python yang membolehkan anda menggunakan corak teks berasaskan SNOBOL;
  • Jurubahasa Mini SNOBOL, ditulis dalam F #;
  • Pelaksanaan makro SNOBOL4 di C.

Pembelajaran Komuniti dan Berkelanjutan

  • Yahoo Email Group, untuk pemaju SNOBOL dan orang yang bekerja dengan teknologi pemprosesan teks yang serupa;
  • SNOBOL4.com, laman web mengenai bahasa dari syarikat yang diasaskan oleh Mark Emmer, penulis beberapa buku dan tutorial mengenai bahasa itu;
  • Senarai senarai SNOBOL.

Buku mengenai SNOBOL

  • Buku Umum Laguage:
    • A Snobol4 Primer, oleh Ralph Griswold: pengenalan asas kepada bahasa, yang ditulis oleh salah seorang penciptanya;
    • Bahasa Pengaturcaraan Snobol4, oleh Ralph Griswold: disebut “Buku Hijau”, ini adalah buku klasik mengenai bahasa tersebut;
    • String and List Processing di Snobol 4: Teknik dan Aplikasi, oleh Ralph Griswold;
    • Pengenalan Programmer kepada Snobol, oleh Ward Douglas Maurer.
  • Topik Khas dalam Pengaturcaraan SNOBOL:
    • Pengaturcaraan SNOBOL untuk Kemanusiaan, oleh Susan Hockey;
    • Algoritma dalam Snobol 4, oleh James Gimpel;
    • Pelaksanaan Makro Snobol 4: Kajian Kes Pembangunan Perisian Bebas Mesin, oleh Ralph Griswold.

Sekiranya saya belajar SNOBOL?

SNOBOL bukan bahasa yang sangat popular, dan tidak banyak majikan yang mencari pembangun SNOBOL. Oleh itu, dari sudut kemajuan kerjaya, anda lebih baik menumpukan perhatian pada bahasa yang lebih banyak permintaan.

Walau bagaimanapun, jika anda berminat dengan pengkomputeran yang berpusatkan teks (carian, terjemahan, pemprosesan bahasa semula jadi, analisis kesusasteraan), anda mungkin ingin meluangkan masa dengan SNOBOL: terutamanya jika anda sudah melangkah batas apa yang dapat dicapai dengan biasa ungkapan.

Alat Teks Lain

Sekiranya anda berminat dengan SNOBOL, anda ingin melihat beberapa alat lain untuk memproses dan menganalisis teks.

  • Toolkit Bahasa Asli, platform Python untuk bekerja dengan data bahasa manusia;
  • Stanford CoreNLP, sekumpulan alat berasaskan Java untuk analisis bahasa semula jadi;
  • Awk, bahasa skrip yang direka khusus untuk pemprosesan teks;
  • Perl, bahasa skrip lain, yang secara meluas dianggap mempunyai pelaksanaan ungkapan biasa yang terbaik;
  • ANTLER adalah Alat lain untuk Pengiktirafan Bahasa, dan boleh digunakan untuk menguraikan bahasa semula jadi dan buatan (komputer);
  • Apache OpenNLP, kit alat pembelajaran mesin untuk pemprosesan bahasa semula jadi;
  • Apache Lucene, sekumpulan alat perisian carian di Java dan Python;
  • GATE, Senibina Umum untuk Kejuruteraan Teks, kerangka kerja untuk “menyelesaikan hampir semua masalah pemprosesan teks;”
  • Prolog, bahasa pengaturcaraan logik yang dicipta untuk pemprosesan bahasa semula jadi;
  • Ikon, bahasa pemprosesan teks lain yang dicipta oleh Ralph Griswold setelah bekerja di SNOBOL.

Anda mungkin juga ingin membaca Taming Text: Cara Mencari, Menyusun, dan Memanipulasinya, oleh Ingersoll, Morton, dan Farris. Buku ini memberikan gambaran keseluruhan pemprosesan teks yang bagus, dengan contoh menggunakan beberapa alat perisian yang disenaraikan di atas.

Akhirnya, lihat TAPoR3, laman web dan komuniti dalam talian yang dikhaskan untuk alat untuk menganalisis teks.

Bacaan dan Sumber Lanjut

Kami mempunyai lebih banyak panduan, tutorial, dan infografik yang berkaitan dengan pengekodan dan pengembangan:

  • Panduan dan Sumber Perl: ini adalah panduan terbaik untuk memulakan bahasa skrip yang hebat ini.
  • Awk Resources: pelajari bahasa skrip kuat ini yang terdapat di kebanyakan komputer.
  • Sumber Prolog: ini akan memulakan anda dengan bahasa pengaturcaraan logik ikonik ini.

Pemprosesan Bahasa Semula Jadi Hidup!

Ilmu pemprosesan bahasa semula jadi telah berkembang sejak zaman SNOBOL. Ketahui semua tentangnya dalam infografik kami, Cara Mengelakkan Jatuh Cinta dengan Chatbot. Ini merangkumi sejarah panjang “berfikir” komputer – dan bahkan mungkin menyelamatkan anda dari hati yang hancur!

Kod Apa yang Perlu Anda Pelajari?
Cara Mengelakkan Jatuh Cinta dengan Chatbot

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map