SNOBOL: uzziniet par šo teksta apstrādes valodu no 60. gadiem

Atklāšana: Jūsu atbalsts palīdz vietnei darboties! Mēs nopelnām nodošanas maksu par dažiem pakalpojumiem, kurus mēs iesakām šajā lapā.


SNOBOL – uz strīpām orientēta un simboliska valoda – ir programmēšanas valodu saime, kas sākotnēji tika izstrādāta 60. gadu vidū, galvenokārt teksta apstrādes un virkņu analīzes vajadzībām.

Īsa piezīme par versijām un ieviešanu

Sākotnējo izstrādātāju pēdējais stabils SNOBOL izlaidums bija SNOBOL4, 1967. gadā. Jūs redzēsit, ka gan grāmatas, gan vietnes izmanto gan “SNOBOL”, gan “SNOBOL4” (un dažreiz arī “Snobol”). Kaut kas pēc 1967. gada visi attiecas uz vienu un to pašu (galīgo) valodas versiju.

Bija arī nedaudz paplašinājumu un ieviešanu. Snocone ir valodas priekšapstrādātājs, kas valodai nodrošina sintaktisko cukuru, padarot to vieglāk lietojamu. SPITBOL ir SNOBOL kompilators; par to ir īpaša interese, jo sākotnēji tika uzskatīts, ka SNOBOL nav savienojams. Ir arī sniegapika programmēšanas valoda, kuru iedvesmoja SNOBOL un kas to nosaukusi.

Šo un citu paplašinājumu dēļ daži cilvēki lieto frāzi “Vanilla SNOBOL”, atsaucoties uz kodu, ar kuru tiek ieviesta tikai sākotnējā SNOBOL4 specifikācija, nevis uz kādām papildu funkcijām.

Par valodu

SNOBOL tika izveidots speciāli teksta un virkņu manipulācijām. Tādēļ tam ir salīdzinoši unikāla īpašība: modeļus uzskata par pirmās klases datu tipiem. Tas ļauj manipulēt ar pašiem modeļiem, tāpat kā ar jebkuru citu datu struktūru. Turklāt stīgas var uzskatīt par kodu un novērtēt. Tas ļauj rekursīvi izmantot modeļus un ļoti sarežģītu virkņu apstrādi un analīzi. SNOBOL programma pat var mainīt savu avota kodu.

Šabloni SNOBOL var būt vienkārši, piemēram, īsi teksta fragmenti vai regex veida rakstzīmju veida virknes. Bet tie var būt arī ārkārtīgi sarežģīti, piemēram, valodas gramatikas pilns oficiālais apraksts. Programmējošos valodu tulkus var rakstīt SNOBOL, kā arī dabiskās valodas gramatikas analīzi, pareizrakstības pārbaudi un (teorētiski) tulkošanas motorus.

SNOBOL bija ļoti populārs datorzinātņu akadēmijā 1960. un 70. gados, un to plaši izmantoja humanitārajās zinātnēs līdz 1980. gadiem. Šajā brīdī tas vairs nav izmantots, par labu mazāk jaudīgai regulārās izteiksmes programmēšanai, izmantojot tādas valodas kā Awk un Perl. Joprojām ir nedaudz lojālu SNOBOL izstrādātāju, un valodai ir potenciāls būt tikpat noderīgai kā jebkad.

Tiešsaistes konsultācijas

  • Snobol4 apmācība, Marka Emmera apmācība no 1985. gada;
  • Emmers arī uzrakstīja Vanilla Snobol4: Tutorial and Reference Manual (PDF) un Macro SPITBOL: High Performance SNOBOL4 Language (PDF);
  • Izmantojot SNOBOL / SITBOL vietnē TWENEX.ORG, šī apmācība ir paredzēta SITBOL SNOBOL ieviešanai, izmantošanai SDF publiskās piekļuves TOPS-20 sistēmā – šeit ir dažas dīvaini specifiskas platformas instrukcijas, bet arī laba apmācība par pašu SNOBOL;
  • SNOBOL4 Powerpoint prezentācija, tas nodrošina tikai slaidus no prezentācijas par SNOBOL – tas nav lielisks atsevišķs ievads, taču ir vērts meklēt pārskatu par galvenajām koncepcijām;
  • Izmantojot SNOBOL MTS, ceļvedis valodas lietošanai lieldatoru Mičiganas termināļu sistēmā – tas var būt noderīgi kopā ar Hercules emulatoru, ja jums jāstrādā pie mantotās SNOBOL sistēmas.

Rīki

  • SPITBOL, apkopota SNOBOL ieviešana, pieejama vietnē Github;
  • SnoPy, Python bibliotēka, kas ļauj izmantot uz SNOBOL balstītus teksta modeļus;
  • Mini SNOBOL tulks, rakstīts F #;
  • SNOBOL4 makro ieviešana C.

Sabiedrība un notiekošās mācības

  • Yahoo e-pasta grupa SNOBOL izstrādātājiem un cilvēkiem, kuri strādā ar līdzīgām teksta apstrādes tehnoloģijām;
  • SNOBOL4.com, vietne par valodu, no uzņēmuma, kuru dibinājis Marks Emmers, vairāku grāmatu un apmācību par valodu autors;
  • SNOBOL saraksta serveris.

Grāmatas par SNOBOL

  • Vispārīgas grāmatas par valodu:
    • Snobol4 Primer, autors Ralfs Grisvolds: valodas ievads, ko uzrakstījis viens no tās izgudrotājiem;
    • Snobol4 programmēšanas valoda, autors Ralfs Grisvolds: saukta par “Zaļo grāmatu”, šī ir klasiskā valodas valoda;
    • Stīgu un sarakstu apstrāde Snobol 4: metodes un pielietojumi, autors Ralfs Grisvolds;
    • Programmētāja ievads Snobol, izveidoja Ward Douglas Maurer.
  • Īpašās tēmas SNOBOL programmēšanā:
    • SNOBOL humanitāro zinātņu programmēšana, autore Sūzena Hokeja;
    • Džeimsa Gimpela algoritmi Snobolā 4;
    • Snobol 4 makroieviešana: no mašīnām neatkarīgas programmatūras izstrādes gadījuma izpēte, autors Ralfs Grisvolds.

Vai man vajadzētu iemācīties SNOBOL??

SNOBOL nav šausmīgi populāra valoda, un nav daudz darba devēju, kas meklē SNOBOL izstrādātājus. Tātad, raugoties no karjeras izaugsmes viedokļa, jums ir labāk koncentrēties uz valodām, kurās ir vairāk pieprasījuma.

Tomēr, ja jūs interesē uz tekstu orientēta skaitļošana (meklēšana, tulkošana, dabiskās valodas apstrāde, literārā analīze), jūs varētu vēlēties kādu laiku pavadīt ar SNOBOL: it īpaši, ja jūs jau esat nosprauduši robežas tam, ko var paveikt ar regulāru izteicieni.

Citi teksta rīki

Ja jūs interesē SNOBOL, ieteicams izlasīt dažus no šiem citiem teksta apstrādes un analīzes rīkiem.

  • Dabiskās valodas rīku komplekts, Python platforma darbam ar cilvēku valodas datiem;
  • Stanford CoreNLP, uz Java balstītu rīku komplekts dabiskās valodas analīzei;
  • Awk, skriptu valoda, kas īpaši izstrādāta teksta apstrādei;
  • Perl, vēl viena skriptu valoda, ko plaši uzskata par vislabāko regulārās izteiksmes ieviešanu;
  • ANTLER ir cits rīks valodu atpazīšanai, un to var izmantot gan dabisko, gan mākslīgo (datoru) valodu parsēšanai;
  • Apache OpenNLP, mašīnmācīšanās instrumentu komplekts dabiskās valodas apstrādei;
  • Apache Lucene, meklēšanas programmatūras rīku komplekts Java un Python;
  • GATE, teksta inženierijas vispārīgā arhitektūra, ietvars “gandrīz jebkuru teksta apstrādes problēmu risināšanai”;
  • Prolog, loģiska programmēšanas valoda, kas izgudrota dabiskās valodas apstrādei;
  • Ikona, cita teksta apstrādes valoda, ko izveidojis Ralfs Grisvolds pēc sava darba SNOBOL.

Iespējams, vēlēsities izlasīt arī Ingersoll, Morton un Farris saīsinājumus Teksts: kā to atrast, organizēt un manipulēt. Grāmatā sniegts lielisks teksta apstrādes pārskats ar piemēriem, izmantojot vairākus no iepriekš uzskaitītajiem programmatūras rīkiem.

Visbeidzot, apskatiet TAPoR3 – vietni un tiešsaistes kopienu, kas veltīta teksta analīzes rīkiem.

Turpmākie lasījumi un resursi

Mums ir vairāk ceļvežu, mācību materiālu un infografiku, kas saistīti ar kodēšanu un attīstību:

  • Perla ceļvedis un resursi: tas ir lielisks ceļvedis, lai sāktu darbu ar šo jaudīgo skriptu valodu.
  • Awk resursi: iemācieties šo jaudīgo skriptu valodu, kas pieejama lielākajā daļā datoru.
  • Prolog resursi: tas ļaus jums sākt darbu ar šo ikonisko loģikas programmēšanas valodu.

Dabas valodas apstrāde atdzīvojas!

Dabiskās valodas apstrādes zinātne ir nogājusi garu ceļu kopš SNOBOL laikiem. Uzziniet visu par to mūsu infografikā Kā izvairīties no iemīlēšanās tērzētavā. Tas aptver datoru “domāšanas” garo vēsturi – un pat varētu jūs glābt no salauztas sirds!

Kāds kods jums jāiemācās?
Kā izvairīties no iemīlēšanās tērzētavā

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map