A szervezés szemantikai alapelvei a következők: Mi a szemantika egyszerű szavakban? Egységes információs tér

Idegen nyelvek, filológia és nyelvészet

Az objektivitás elve: a mondatnak a benne szereplő nevekkel jelölt tárgyakról kell beszélnie, nem pedig magukról a nevekről. A Szék mondat helyesen megszerkesztett főnév. A felcserélhetőség elve: az azonos jelentésű nevek lecserélésekor a mondat, amelyben ezt a helyettesítést végrehajtják, nem változtathatja meg az igazságértékét, az igaz mondatnak igaznak, a hamisnak pedig hamisnak kell maradnia. Legyen az a mondat, hogy a Föld a Nap körül kering.

Szemantikai alapelvek

Az egyértelműség elve:minden névnek csak egy jelentése lehet (kiterjesztés). Ennek az elvnek a megsértése a „értékhelyettesítés».

A Plútó létezését csillagászok bizonyították.

A Plútó egy isten.

Isten létezését csillagászok bizonyították.

Itt a „Plútó” szót kétféle értelemben használjuk: az első premisszában a Naprendszer bolygóját, a másodikban az ókori görög mitológiából származó istenséget jelenti. Ha egy szó jelentése ennyire eltér egymástól, a helyettesítés könnyen észrevehető. De ha legalább részben egybeesnek egymással, például az egyik közönséges, a másik pedig extenzív (vagy fordítva, speciális), akkor a hiba észrevétlen marad. Előfordul, hogy az értéket több lépésben módosítják, amelyek mindegyike önmagában nem kelt gyanút.

Az objektivitás elve:a mondatnak a benne szereplő nevekkel jelölt tárgyakról kell beszélnie (és nem magukról ezekről a nevekről). Ennek az elvnek a megsértése a „autonóm névhasználat».

Hasonlíts össze két mondatot: 1)A szék egy bútordarab 2) A szék egy főnév.Az elsőben a „szék” szót helyesen használják, mivel egy tárgyról beszélünk, a másodikban pedig önállóan használják, mivel magáról a szóról beszélünk. Az ilyen hibák elkerülése érdekében mindig használjon idézőjeleket olyan esetekben, amikor a nyelvi kifejezésekről kell valamit mondani. ajánlat "A "szék" egy főnév"helyesen épült. Ha figyelmen kívül hagyjuk az idézeteket, azt kockáztatjuk, hogy meglehetősen nevetséges következtetésre jutunk:

A szék egy főnév.

Néhány széknek négy lába van

Néhány főnévnek négy törzse van.

A felcserélhetőség elve:az azonos jelentésű nevek lecserélésekor az a mondat, amelyben ezt a helyettesítést végrehajtják, nem változtathatja meg az igazságértékét (az igaz mondatnak igaznak kell maradnia, a hamis mondatnak pedig hamisnak kell maradnia).

Adjuk meg a „Föld kering a Nap körül” mondatot. Cseréljük le a „Nap” szót „a Naprendszer központi testével”. Nyilvánvaló, hogy ezeknek a kifejezéseknek ugyanaz a jelentése. A helyettesítés eredményeként egy igaz mondatból egy másik igaz mondatot kapunk: „A Föld a Naprendszer központi teste körül forog.”

A felcserélhetőség elve magától értetődőnek tűnik, de vannak olyan nyelvi összefüggések, amelyekben az egyenlőt egyenlőre cserélni ellentmondáshoz vezet. Vegyük fontolóra a mondatot: „Ptolemaiosz azt hitte, hogy a Nap a Föld körül kering”. Ezt hitte igaznak. Nézzük meg. Helyettesítsük a „Nap” szót „a Naprendszer központi teste” kifejezéssel, amelynek jelentése ugyanaz. Azt a következtetést kapjuk: „Ptolemaiosz azt hitte, hogy a Naprendszer központi teste a Föld körül kering”, ami abszurd.

A logika szerint az ilyen helyzeteket "a névadási reláció antinómiái» akkor keletkeznek, amikor egy bizonyos tárgyat az alany egyik szempontból ismer (kellemes, hozzáférhető stb.), más szempontból pedig ismeretlen (kellemetlen, hozzáférhetetlen stb.). Ez néha azt eredményezi, hogy ugyanazon objektum két megnevezése nyilvánvalóan összeegyeztethetetlen.

Hogyan őrizzük meg a felcserélhetőség elvét és kerüljük el az antinómiákat? Különbséget kell tenni a nyelvi kifejezések használatának két módja között. Elsőkiterjesztő, amelyben a kifejezések egyszerűen kiemelik az objektumokat. Másodikintenzív: a kifejezésekkel jelölt objektumokat egy bizonyos értelemben, szempont szerint tekintjük (ennek indikátora lehet az ún.episztemikus operátoroka „tud”, „hisz”, „keres”, „gondolkodik” stb. szavakat). Ha egy kifejezést egy bizonyos vonatkozásban használunk, akkor csak akkor helyettesíthető egy másik azonos jelentésű kifejezéssel, ha az objektumokat a második kifejezésben veszik figyelembe ugyanabban a vonatkozásban.

Valamint más művek, amelyek érdekelhetik
81121.		A föld óceánjai	41,5 KB
	Folytassa az elképzelés kialakítását a föld felszínéről és annak képéről a földgömbön és a térképen; bevezetni az óceán fogalmát az óceánok nevével; javítsa a térképpel való munkavégzés képességét tankönyv segítségével; fejlessze a helyzet fogalmainak magyarázatának, összehasonlításának, elemzésének képességét...
81122.		„Pivnik és két célpont” (ukrán népmese)	51 KB
	Méta: tanítsa meg a tanulókat a mesék és a jó hősök mélyreható megértésére, a ravaszság, az orvostudomány elsajátítására, a mindennapi életben való küzdelemre; fejlessze az olvasás képességét az emberek számára, parafrázis; vikhovuvati bazhanna, hogy segítsen másokon, hogy buzgóvá váljon. Birtoklás: illusztrációk a mese előtt, „Spikelet” rajzfilm.
81123.		Roslinok királyságában	44,5 KB
	Méta: ismerje meg a tanulókat a rózsák méreteiből; fogalmazza meg a fa, bokor, lágyszárú bokor fogalmát; olvassa el a fák gyümölcsét; aktív óvatosság fejlesztése gyermekeknél; megragadni a szeretetet a növény természete iránt, megóvni és növelni szépségét.
81124.		A régió időjárása ellentmond a sorsnak. Pre-bachenya várni népi jeleket	51,5 KB
	Méta: folytassa szülőföldje megértésének megfogalmazását; fogalmakat fogalmazzon meg szülőföldje időjárásáról; megismertesse a diákokat a szél létrehozásának folyamatával; növelje a gyermekek esésekkel kapcsolatos tudatosságát; beszélni az emberek időjárás-előrejelzéséről; fejleszti a kognitív érdeklődést, az óvatosságot...
81125.		Motanka lyalka "Dzvinochok"	39 KB
	Felszerelés: Kerek alakú és különböző méretű szövetdarabok (egyik kisebb, mint a másik), rugalmas szalagok csavaráshoz, újságpapír, fehér színű szövetcsíkok téglalap alakú, kötött formájú szövetdarabok vágott színben. Bemutatóbabák: rituálék – 3 db, egyéb – 4 db.
81126.		Stitch „előre gól”, yogo znachennya, yomi vikonannya. Kiszolgált varrás	43 KB
	Méta: tanulja meg előre varrni a varrást a nyakon, és élvezze az anyaggal együtt, alakítsa ki tiszteletét a szeretet és az anyaszeretet kultúrájának gondolatai és esztétikai ízlése iránt, összpontosítson a hímző-varró szakma mesterségbeli tudására. Miért szeretnél megtanulni varrni és hímezni?
81127.		Ukrán ház. Charms	73 KB
	Méta: tanulj meg boncolni egy régi ukrán házat a mai Budynkiből; bővítse és elmélyítse a gyermekek ismereteit az amulettek jelentésének sajátosságairól az ukrán nemzetközi világban; fejlessze nyelvtudását, gazdag szókincsre tegyen szert, tanulja meg az ukrán mindennapi élet tárgyainak nevét...
81128.		Biztonságos viselkedés otthon. Háztartási gépek használata. Tüzek és balesetek okai. Legyen óvatos a gyógyszerekkel	61 KB
	Cél: általánosítsa és rendszerezze a gyermekek ismereteit a vészhelyzetekben való viselkedésről; tanítsa meg a tanulókat szélsőséges helyzetekben való cselekvésre; dolgozzon a tűz, elektromos készülékek, gyógyszerek, gáz biztonságos kezelésével kapcsolatos utasításokkal, „egyedül otthon” helyzetben való viselkedéssel...
81129.		Emberi erények. A jóság veled kezdődik	43 KB
	Cél: a tanulók további megismertetése az emberi erényekkel; megtanítani a cselekvéseket és jelenségeket a jó és a rossz megnyilvánulásaiként jellemezni; feltárja a kedvesség erkölcsi tartalmát; fejleszteni a kedvesség, az empátia és a nagylelkűség érzését.

A társadalmak fejlődése összefügg
éppen az eszközök fejlesztésével
tagjainak információs interakciója,
és különösen az építési eszközök
és teljes memóriájuk felhasználása.

Sztanyiszlav Jankovszkij

Megfelelően szervezett szemantikus web
hozzájárulhat az evolúcióhoz
minden emberi tudás egésze.

Sir Tim Berners-Lee

A számítógéppel segített tervezőrendszerek közelednek ahhoz a küszöbhöz, amelyet a szemantikai technológiák lavina követ majd. Az e technológiák iránti érdeklődés mindenütt megnyilvánul, ahol bonyolult adatszerkezetek és nehezen formalizálható döntéshozatali eljárások vannak, amelyek az objektumok viselkedéséről és interakciójáról szóló empirikus ismereteken alapulnak. A szemantikus adatmodellek használata a CAD-ben az intelligens rendszerek új osztályát hozza létre a döntéshozatal magas szintű automatizálásával.

A gyártás során minden tárgy: anyagok, alkatrészek, berendezések, technológiai berendezések - folyamatos kölcsönhatásban van. Ezen objektumok jellemzőit külön adatbázisok tárolják, viselkedésük és kompatibilitásuk szabályait pedig különféle alkalmazási alkalmazások algoritmusai tárolják. Az adatok és a tudás egyetlen szemantikai modelljévé való egyesítése a témakörben lehetővé teszi a vállalat intelligens információs terének felépítését, amely megbízható döntések alapjául szolgál a tervezésben, a gyártásban és az irányításban.

A szemantikai hálózat „egy tárgyterület információs modellje, irányított gráf formájában, amelynek csúcsai a tárgyterület objektumainak felelnek meg, és ívek (élek) határozzák meg a köztük lévő kapcsolatokat” (1. ábra).

A szoftverek evolúciós fejlődése a rendszerszintű komponensek fokozatos egységesítéséből áll. A következő öt évben a hangsúly elkerülhetetlenül a szoftverfejlesztésről az alkalmazott szemantikai adatmodellek létrehozására helyeződik át. Az ezekben a modellekben használt kifejezések, fogalmak és kapcsolatok szabványosítása és egységesítése kulcsfontosságú tényező lesz bármely információs rendszer fejlesztésében. Az objektumparadigma szemantikaira váltása és az adatmodellek egységesítése a fő irány, ami növeli a döntéshozatal automatizálásának szintjét és szabványosítja a különböző alkalmazások közötti információcsere protokollokat (2. ábra).

Történelmileg elkerülhetetlen a rendszerek egy új osztályának megjelenése, amelyek a tantárgyi területek szemantikai modelljeit valósítják meg. E modellek felépítéséhez kedvező környezetet jelenthetnek a Master Data Management (MDM) osztályba tartozó alkalmazások, amelyek egyesítik a nem tranzakciós jellegű vállalkozás összes referenciaadatát.

Ennek az iránynak a keretein belül a szabályozási és referenciainformációk (RNI) duplikálási és szinkronizálási problémái megszűnnek. Egységes osztályozási és kódolási rendszer bevezetése folyamatban van. A referenciaadatok tárolására, kezelésére és elérésére szolgáló központosított rendszer megvalósítása folyamatban van, kilátás nyílik az adatok megjelenítésének és cseréjének szabványosítására. A „cselekvés színtere” megnyílik a tudás-működtető mechanizmusok bevetésére.

Az MDM módszertana a vállalatban keringő referenciaadatokat a vállalati információs rendszerek egységes kommunikációs nyelvének tekinti. Magától értetődik, hogy a termékinformációkat csak akkor lehet megosztani és kicserélni, ha a feladó és a címzett is ugyanazokat a referenciaadatokat használja.

Így a referenciaadatok konszolidációja, feldolgozási szolgáltatásaik egységesítése, az ismeretek szemantikai modellekbe történő konszolidációja és az adatcsere-formátumok szabványosítása terén újításokkal foglalkozunk.

Az MDM-rendszerek fejlesztésének kilátása a fenti újítások felkarolása, és a DBMS-osztályú alkalmazások mellett bármely vállalat informatikai infrastruktúrájának rendszerszintű összetevőivé válnak.

Nézzük meg a szemantikus MDM rendszerek felépítésének alapelveit.

Adatkonszolidáció

A referenciaadattárnak kell lennie az egyetlen helynek, ahol az adatok hozzáadódnak, módosíthatók vagy törölhetők (3. ábra). Az MDM a rendszerek egy független osztálya, amely nem foglalhat el alárendelt pozíciót semmilyen alkalmazási rendszerhez, például ERP-hez vagy PDM-hez képest.

A tudás megszilárdítása

Ha a döntési szabályokat az adatmodell szintjére helyezi át, azok minden vállalati alkalmazás számára elérhetővé válnak. A tématerületek szemantikai modelljeinek felépítésére való összpontosítás biztosítja az automatizálás maximális szintjét, mivel a szemantikai referenciaadat-adatbázisba bekerült privát megoldások megfelelően formalizálódnak, és különféle alkalmazási rendszerekben újra felhasználhatók (4. ábra).

Egységes információs tér

A szemantikus MDM rendszer egy összevont referenciaadattér. Az információkat az elsődleges rendszerekből gyűjtik össze, és egyetlen állandó tárolási helyre integrálják. A könyvtárak egy részének rajta kívülre helyezése megszakítja az objektumok közötti kapcsolatokat, ami sérti a tudásrendszer integritását és jelentősen korlátozza a szemantikai hálózat kiépítésének lehetőségeit (5. ábra).

Sokoldalúság és bővíthetőség

A domain modellt folyamatosan módosítják és fejlesztik. Új objektumok jönnek létre, viselkedésük, kapcsolataik szabályai megváltoznak. Egy szemantikus MDM rendszernek képesnek kell lennie alkalmazkodni ezekhez a változásokhoz, vagyis ténylegesen végrehajtási környezetnek kell lennie egy tartománymodell számára, függetlenül annak konkrét tartalmától.

Környezetérzékeny adatmegjelenítés

Az MDM rendszernek lehetővé kell tennie az objektumok különböző perspektívákból való megtekintését. Például egy folyamatmérnöknek látnia kell a munkadarab és a forgácsolószerszám mozgatásának mechanizmusait egy fémforgácsoló gépben, a gépészmérnöknek pedig azokat az alkatrészeket és alkatrészeket, amelyekre megelőző vizsgálatot kell végezni (6. ábra).

Az objektum kontextuális nézőpontja nem korlátozódik csak a felhasználó szerepére, hanem az idő függvényében, pontosabban az objektum életciklusának szakaszaitól, valamint funkcióinak (céljának) függvényében változik.

Az anyagi tárgyaknak két fő tulajdonságuk van: szerkezetük és aktivitásuk. Egy objektum belső szerkezetének kontextuális ábrázolása dinamikusan változik attól függően, hogy milyen folyamatokban vesz részt. Azt mondhatjuk, hogy az objektumokat a velük lehetséges cselekvések határozzák meg.

Adatcsere-formátumok szabványosítása

Az adatszinkronizálás és -egyesítés témája messze túlmutat az egyes vállalkozások érdekein. A nemzetközi szabványok előírásai szerint a termékbeszállítóknak elektronikus formában kell átadniuk a vevőnek a katalogizáláshoz szükséges műszaki információkat a termékről. A különböző gyártók termékeinek elektronikus katalógusokban való kombinálása azt jelenti, hogy a termékek leírásánál ugyanazokat a szótári kifejezéseket és megnevezéseket kell használni.

Ma két alternatív lehetőség létezik az adatcsere-formátumok szabványosítására. Az elsőt az ISO 22745 szabvány valósítja meg, amely magában foglalja az International Electronic Commerce Code Management Association (eOTD ECCMA) nyílt műszaki adatszótárának használatát.

Az eOTD szótárak a hasonló szemantikai tartalmú kifejezések és definíciók összekapcsolására szolgálnak. Lehetővé teszik egyedi, világméretű azonosító hozzárendelését bármely kifejezéshez, tulajdonsághoz vagy osztályhoz. Ezen azonosítók alapján lehet megegyezni a különböző automatizált rendszerekben található anyagi és műszaki objektumok leírásaiban (7. ábra).

A Rostekhregulirovaniya 1921. számú, 2006. július 19-én kelt megrendelésének megfelelően kialakul az eOTD ECCMA nyílt műszaki szótár orosz változata, amelynek célja a különböző beszállítók termékeivel kapcsolatos információk harmonizálása az elektronikus termékkatalógusok fejlesztési költségeinek csökkentése érdekében.

A második lehetőséget az ISO 15926 szabvány valósítja meg, amely az ISO 22745-től eltérően ontológiai jellegű, mivel szabványosítja az objektumok szerkezetét. Olyan adatmodellt határoz meg, amely egyetlen kontextusban határozza meg az életciklus-információ jelentését, amely támogatja a feldolgozómérnökök, berendezésmérnökök, kezelők, karbantartó mérnökök és mások által a termékekről esetlegesen előforduló leírások összes csoportját (ISO 15926, 1. rész).

A referencia adatmodellt, amely alapján javasolt az alkalmazási adatmodellekkel való szinkronizálás, az ISO 15926 szabványban az RDL (Reference Data Libraries) könyvtár implementálja.

Egy új alkalmazás integrálását a vállalat egyetlen információs terébe úgy kell kezdeni, hogy ennek az alkalmazásnak az alkalmazásmodelljének osztályait és attribútumait egyeztetjük a referenciamodell megfelelő definícióival, amely a különböző automatizált rendszerek közötti kommunikáció vállalati nyelve. vállalkozás (8. ábra).

Az ISO 15926 használatával kapcsolatos munkát a Rosatom State Corporation és az FSUE Sudoexport aktívan végzi. A Rosatom 2008. december 26-án kiadta a 710. számú végzést, amely előírja: „A Rosatom State Corporation és szervezetei az atomerőművek életciklusának és a tüzelőanyag-termelés minden szakaszában a termelési információs modellek létrehozása és alkalmazása során, az információkezelési folyamat során az adatintegráció érdekében az ISO 15926 nemzetközi szabvány előírásai szerint kell eljárni, amelyhez megfelelő vállalati szabványokat kell kidolgozni.”

Szemantikai technológiák a CAD-ban

A gépgyártó vállalkozásoknál működő számítógépes tervezési (CAD) rendszerek a referencia információk fő fogyasztói. Anyagtechnikai tárgyakra vonatkozó adatok: berendezések, anyagok, berendezési tárgyak - a lehető legtöbb részletezést igénylik. A CAD nem csak az objektumok műszaki paraméterei szempontjából érdekes, hanem a gyártási folyamat összefüggésében a köztük lévő kapcsolatok is. A szemantikus MDM-rendszer képességei lehetővé teszik a CAD-alkalmazások számára, hogy „értelmes” keresést hajtsanak végre a törzsadat-adatbázisban, amely magában foglalja mind a keresett objektum paramétereit, mind pedig a más objektumokkal való interakció szabályait.

Például egy forgácsolószerszám keresésekor nemcsak a jellemzőit, hanem bármely más, vele összefüggő tárgyat is meg lehet adni kritériumként: a munkadarab anyagát, a megmunkálási sémát, a rögzítést, a fémvágó gépet. A rendszer kiválasztja a szükséges eszközt, amely kompatibilis a szomszédos objektumok példányaival (9. ábra).

Rizs. 9. A keresési terület szűkítése összekapcsolt objektumok szemantikai hálózatában

A szemantikus keresés kulcsfontosságú ügyfélérték, amely versenyelőnyt biztosíthat a CAD számára azáltal, hogy növeli a döntési automatizálás szintjét a tervezési folyamatban.

Ez a megközelítés a szemantikus webes technológiák alapja. A szemantikai technológiák már túljutottak a fejlesztés kezdeti szakaszán, és a vezető elemzők komolyan tekintik őket valódi erőnek: „A következő tíz évben a webes technológiák javítani fogják a dokumentumok szemantikai szerkezettel való felruházási képességét, strukturált szókincsek és ontológiák létrehozását a kifejezések meghatározásához. , fogalmak és kapcsolatok...” ("Finding and Exploiting Value in Semantic Technologies on the We" elemző jelentés (Gartner, 2007).

Thomas Grubber szerint az ontológia egy bizonyos tématerület specifikációja, amely kifejezések, fogalmak és objektumok osztályai, valamint a köztük lévő kapcsolatok leírása. Az ontológia célja, hogy konzisztens, egységes szótárat biztosítson a különféle vállalati információs rendszerek interakciójához.

Az ontológia felépítésének legegyszerűbb példája az axiális forgácsolószerszám szerkezetében az összekötő és vágó részek önálló osztályozott objektumokként történő azonosítása, ami lehetővé teszi, hogy hasonló eszközök leírásának készítésekor is felhasználhatók legyenek, mint pl. „fúró”, „süllyesztő” , „dörzsár”, „végmaró” stb. d. (10. ábra).

Egy objektum ontológiai modelljének megalkotása nélkül lehetetlen formalizálni más entitásokkal fennálló kapcsolatait, mivel két objektum kompatibilitásának szabályait az alkotórészeik átfogó kompatibilitása határozza meg (11. ábra).

A tárgyterület objektumok egységes leírásának egy közös könyvtárba gyűjtése és a hozzá való hozzáférés biztosítása a különböző alkalmazásokból megoldja az adatcsere-formátumok szabványosításának problémáját. Egy ilyen könyvtár elhelyezése a Globális Hálózaton megoldja az adatintegráció problémáját iparági, állami és államközi szinten.

A JORD (Joint Operational Reference Data) európai projekt részeként 2008 óta az ISO 15926 nyílt nemzetközi szabványon alapuló ontológiai adatmodellek könyvtára készül, melyben bárkinek lehetősége van saját ontológiai adatmodelljét elhelyezni. Ennek a könyvtárnak az interneten történő éves előfizetése 25 ezer euróba kerül.

Vállalati referenciaadat-kezelő rendszer Semantic

Az SDI Solution cég egy új vállalati referenciaadat-kezelő rendszer, a Semantic megjelenéséről tájékoztat (12. ábra). Ez a szoftvercsomag egy információkereső rendszer funkcionalitását fejlesztette ki, és egyúttal referenciaadat-szolgáltatóként is szolgál a CAD, PLM és ERP számára.

A Semantic rendszer támogatja a vállalati üzleti folyamatokat a törzsadatok kezeléséhez: adatbevitel, frissítés, hozzáférés, ellenőrzés, beleértve a változástörténet és az adathasználat megőrzését. Megvalósítja az objektumok több szempontú parametrikus és szemantikai keresését. Lehetővé teszi adatok tárolását különböző környezetekben: Oracle, MS SQL Server, FireBird. A Semantic rendszer funkcionalitásának részletesebb leírása a CAD és Graphics magazin következő számában jelenik meg.

Andrey Andrichenko, Ph.D., MBA diploma, a CAD TP Autoproject és a CAD TP VERTICAL szerzője és fejlesztője.

1984-1987 - CAD végzettségű iskola.

1987-1997 - fej. A Repüléstechnológiai Kutatóintézet (NIAT) CAD TP osztálya.

1997-2002 - az ICC Oberon vezérigazgatója.

2002-2011 - az ASCON technológiai részlegének vezetője.

2011 - Az SDI Solution CJSC igazgatótanácsának elnöke.

annotáció

A cikk a szövegek szemantikai elemzésének problémáival foglalkozik. Különféle módszereket veszünk figyelembe: fogalmi függőségi diagramok és szemantikai hálózatok; lexikális függvényeken és témaosztályokon alapuló megközelítések; keret és ontológiai modellek; a tudásreprezentáció logikai modelljei. Mindegyiknek megvannak a maga előnyei és hátrányai.

A szövegek szemantikai elemzésére szolgáló új módszerek létrehozása számos számítógépes nyelvészeti probléma megoldásában releváns, mint például a gépi fordítás, az automatikus összegzés, a szövegosztályozás és mások. Ugyanilyen fontos a szemantikai elemzés automatizálására szolgáló új eszközök kifejlesztése.

Szemantikai szövegelemzés módszerei és rendszerei

A szemantika a nyelvészet egyik ága, amely a nyelvi egységek szemantikai jelentését vizsgálja. A szemantika a nyelv szerkezetére vonatkozó ismeretek mellett szorosan kapcsolódik a filozófiához, a pszichológiához és más tudományokhoz is, hiszen óhatatlanul kérdéseket vet fel a szavak jelentéseinek eredetével, léthez és gondolkodáshoz való viszonyával kapcsolatban. A szemantikai elemzés elvégzésekor figyelembe kell venni az anyanyelvi beszélő társadalmi és kulturális jellemzőit. Az emberi gondolkodás folyamata, akárcsak a nyelv, amely a gondolatok kifejezésének eszköze, nagyon rugalmas és nehezen formalizálható. Ezért a szemantikai elemzés joggal tekinthető az automatikus szövegfeldolgozás legnehezebb szakaszának.

A szemantikai szövegelemzés új metódusainak létrehozása új lehetőségeket nyit meg és tesz lehetővé
jelentős előrehaladást ér el számos számítógépes nyelvészeti probléma megoldásában, mint például a gépi fordítás, az automatikus összegzés, a szövegosztályozás és mások. Nem kevésbé fontos a szemantikai elemzés automatizálására szolgáló új eszközök fejlesztése.

Jelenleg számos módszer létezik az állítások jelentésének ábrázolására, de egyik sem univerzális. Sok kutató dolgozott azon, hogy összefüggésbe hozza a szöveg jelentését. Szóval, I.A. Melchuk bevezette a lexikális funkció fogalmát, kidolgozta a szintaktikai és szemantikai vegyérték fogalmát, és egy magyarázó-kombinatorikus szótár kontextusában vette figyelembe, amely egy nyelvi modell. Megmutatta, hogy a szavak jelentései nem kapcsolódnak közvetlenül egymáshoz
a környező valósággal, hanem az anyanyelvi beszélőnek erről a valóságról alkotott elképzeléseivel.

A legtöbb kutató hajlamos azt gondolni, hogy a szemantikai elemzést a szintaktikai elemzés után kell elvégezni. V.Sh. Rubashkin és DG. Lahuti bevezette a szintaktikai kapcsolatok hierarchiáját a szemantikai elemző hatékonyabb működése érdekében. A legfontosabbak a kötelező szerepkapcsolatok, ezt követik a korreferencia kapcsolatok, majd az opcionális szerepkapcsolatok, és csak ezután következnek az alany-asszociatívak.

A híres nyelvész E.V. Paducheva azt javasolja, hogy vegyék figyelembe a szó tematikus osztályait, különösen az igéket, mivel ezek hordozzák a fő szemantikai terhelést: az észlelés igék, a tudás igék, az érzelmek igék, a döntéshozatal igék, a beszédműveletek, a mozgás, a hang igék, az egzisztenciális igék, stb. Ebben a megközelítésben lényeges az az elképzelés, hogy a nyelvi fogalmakat bizonyos szemantikai csoportokra osztják, figyelembe véve azt a tényt, hogy ezeknek a fogalmaknak van néhány nem triviális közös szemantikai összetevője. Az ilyen csoportok elemei általában ugyanazokkal a függő fogalmakkal rendelkeznek. Ezzel a megközelítéssel azonban az a fő probléma, hogy a tematikus osztályok azonosítása és a szemantikai szótárak összeállítása rendkívül munkaigényes folyamat, amely nagymértékben függ az adott személy egyéni felfogásától és értelmezésétől.

Az univerzális tudásreprezentációs nyelvnek kényelmes eszköznek kell lennie a meglévő tudásból új ismeretek levezetésére, ami azt jelenti, hogy szükséges egy apparátus létrehozása az állítások helyességének ellenőrzésére. Itt hasznosak a tudásreprezentáció logikai modelljei. Például a szemantikai nyelv, amelyet V.A. Tuzov, tartalmazza az állítmányi logika formalizmusait, „atomi” fogalmakat, e fogalmak feletti „funkciókat” és következtetési szabályokat, amelyekkel az új fogalmak leírhatók. Lehetséges, hogy a tudományos gondolkodás a jövőben az ilyen szemantikai nyelvek létrehozásának irányába fejlődik.

Annak ellenére, hogy a szövegfeldolgozás területén egyes tudományos és műszaki ötletek meglehetősen gyorsan fejlődnek, a szemantikai elemzés számos problémája megoldatlan marad. A legtöbb kutató arra a következtetésre jutott, hogy a szemantikai elemzést támogató szótárnak jelentésekkel kell működnie, és ezért nem szavak, hanem fogalmak tulajdonságait és kapcsolatait kell leírnia. Felmerül azonban a kérdés, hogyan lehet helyesen strukturálni és bemutatni az információkat az ilyen szótárakban, hogy a keresés kényelmes és gyors legyen, és figyelembe lehessen venni a természetes nyelv változásait (a régiek eltűnése és új fogalmak megjelenése). ). Ez a cikk arra tesz kísérletet, hogy rendszerezze a szemantikai elemzés területén elért ismert eredményeket, és bizonyos mértékig választ találjon erre és más kérdésekre.

Szemantika tanulmányozása a „Jelentés ↔ Szöveg” elmélet keretein belül

A „Jelentés ↔ Szöveg” elmélet megalkotásakor I.A. Melchuk bevezette a lexikális funkció fogalmát.
Formális szempontból a lexikális függvény olyan függvény, amelynek argumentumai egy adott nyelv egyes szavai vagy kifejezései, az értékek pedig ugyanazon nyelv szavainak és kifejezéseinek halmaza. Ugyanakkor csak azok a lexikális funkciók érdekesek, amelyeknek frazeológiailag rokon jelentése van, és csak azok tekinthetők, amelyek bizonyos érvekkel lehetségesek, másokkal lehetetlenek.

Más szavakkal, a lexikális funkció egy bizonyos szemantikai kapcsolat, például „jelentésbeli egyenlőség” (Syn), „jelentésben ellentétes” (Anti) stb. Legyen számos lexikai egység - szavak és kifejezések; akkor ez a lexikai függvény mindegyik egységhez hozzárendeli az eredeti egységgel megfelelő szemantikai kapcsolatban álló lexikai egységek halmazát.

Egy-egy lexikai függvény jelentése különböző argumentumokból teljesen vagy részben egybeeshet; Ugyanabból az argumentumból származó különböző függvények értékei is egybeeshetnek. Egy adott argumentumból egy adott lexikai függvény jelentésében szereplő alternatív korrelátumoknak nem kell mindig és bármilyen kontextusban felcserélhetőnek lenniük. Stiláris jellemzőikben, mindenféle kompatibilitásban, nyelvtani felhasználási feltételekben és végül még jelentésben is eltérhetnek. Ez utóbbit különösen fontos hangsúlyozni: a különböző korrelációknak nem kell mindig teljesen szinonimáknak lenniük; elég, ha jelentésüknek van egy adott lexikai funkciónak megfelelő közös része, és a különbségek nem lépnek túl bizonyos határokat, vagyis nem „túl jelentősek”.

Általában nem minden szóra és kifejezésre van meghatározva a lexikális funkció. Először is, bizonyos funkciók csak a beszéd egyik vagy másik részére vannak definiálva: például az Oper, a Func és a Labor csak főneveknél képzelhető el. Másodszor, ez vagy az a funkció csak bizonyos szemantikával rendelkező szavakhoz definiálható: Magn - olyan szavakhoz, amelyek jelentése lehetővé teszi a fokozatosságot ("több - kevesebb"); Az Oper, Func és Labor csak helyzetnevekre van definiálva.

Nem szabad megfeledkezni arról, hogy a lexikális függvénynek még egy teljesen megfelelő (szintaktikai és szemantikai tulajdonságait tekintve) argumentum esetén sem lehet értelme (egy adott nyelven). Például szinonimák elvileg bármilyen szóra lehetségesek, de csak néhányan rendelkeznek velük. Ez a lexikális funkciók frazeológiai természetéből adódik.

Még egyszer hangsúlyozni kell, hogy kezdetben a lexikai funkciókat kifejezetten a lexikális kompatibilitás leírására vezették be, nem pedig az általános értelemben vett jelentés megjelenítésére, ezért nem mindegyiket kell szemantikai egységként értelmezni. A lexikális funkciók és a jelentés közötti kapcsolat korántsem egyértelmű. Egyes lexikai funkciók szemantikai elemek státuszát követelhetik, másoknak egyáltalán nincs jelentése, mások pedig nagyon összetett jelentést takarhatnak.

A mi szempontunkból a lexikális függvényekről „többértékű” függvényként beszélni nem teljesen helyes és kényelmes. Kényelmesebb lexikális predikátumokról beszélni. Az alábbiakban felsoroljuk az egyszerű szabványos lexikai „függvényeket” (itt predikátumok formájában kerülnek bemutatásra).

1. Syn (x, y), x, y – szinonimák.

2. Konv. (x, y), x, y – konverziók.

3. Anti (x, y), x, y – antonimák.

4. Der (x, y), y az x szintaktikai származéka, azaz y jelentésében egybeesik x-szel, de más szófajhoz tartozik:

S0 (x, y), y az x-ből származó főnév (x nem főnév);

A0 (x, y), y – x-ből származó melléknév (x – nem melléknév);

Adv0 (x, y), y – x-ből képzett határozószó (x – nem határozószó);

V0 (x, y), y x-ből képzett ige (x nem ige).

Más szavakkal, "x"y (Der (x, y) « S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Gener (x, y), y – általánosító fogalom az x-nek nevezett fogalommal kapcsolatban (x = eper, y = bogyó). Ez a predikátum az adott nyelv szavak lexikális kompatibilitásának függvénye: ha x és m két különböző nyelv szavai, amelyek jelentése azonos, akkor a Gener (x, y) és Gener (m, n) esetében, y és n nem feltétlenül ugyanazt jelenti.

A helyzet a valóság valamely részének bizonyos lexikális tükröződése (egy adott nyelven). A természetes nyelvek egyedi lexikai egységeivel (lexémák) jelölt helyzetek általában egy-négy szemantikai komponensből vagy szemantikai aktánsból állnak, amelyeket nagy latin A, B, C, D betűk jelölnek. Ugyanakkor mindegyik Az ilyen lexéma mélységi összehasonlítása a szintaktikai aktánsok függői, amelyek megfelelnek az alanynak és az erős tárgyaknak (ha ez a lexéma állítmányi igével valósul meg). A mély szintaktikai aktánsok számozása arab számokkal történik: 1, 2, 3, 4.

6. Si (x, y), i = 1, …, 4, y – az i-edik aktáns tipikus neve x-re.

7. Sc (x, y), y – circonstant, azaz egy adott x helyzet másodlagos összetevőjének tipikus neve:

Sloc (x, y), y – a hely tipikus neve, ahol ez a helyzet x előfordul; "hol..." (x = csata, y = (csatatér));

Sinstr (x, y), y – az adott helyzetben használt eszköz tipikus neve x; „az, ami által/amelyen keresztül...” (x = küzdelem, x = fegyver (a küzdelem));

Smod (x, y), y – egy adott szituáció megvalósítási módjának (módjának, karakterének) tipikus neve x; „az út...” (x = élet, y = (életkép));

Sres (x, y), y – egy adott helyzet eredményének tipikus neve; „ami kijön” (x = másolás, y = másolás).

Más szavakkal, "x"y (Sc (x, y) « Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Korrelatív predikátumok Jel (x, y), y – egy „darab”, egy „kvantum” tipikus neve valamilyen x; Mult (x, y), y – egy gyűjtemény, halmaz tipikus neve.

9. Sigur (x, y), y – x metaforája (x = álom, y = ölelés (álom)).

10. Centr (x, y), y – egy tárgy vagy folyamat „központi” részének tipikus megjelölése.

11. Ai (x, y), i = 1, …, 4, y – az i-edik aktáns tipikus meghatározása valós szerepe szerint; „olyan, amelyik...”; "az aki..."

12. Ablei (x, y), i = 1, …, 4, y – az i-edik aktáns tipikus meghatározása a szituációban betöltött potenciális szerepe szerint; „aki tud...”; "aki tud..."

13. Magn0 (x, y) és Magni (x, y), i = 1, ..., 4, y magának az x helyzetnek (Magn0) vagy annak i-edikének a „magas fokát”, „intenzitását” jelöli. aktáns (Magni).

14. Ver (x, y), y – „helyes”, „célnak megfelelő”, „ahogy kell” x-hez viszonyítva.

15. Bon (x, y), y – „jó” x-hez viszonyítva.

16. Advix (z, y), i = 1, ..., 4, x = A, B, C, D, y – a helyzet neve egy másik helyzetet megnevező ige definíciójaként:

AdviA (z, y), i = 1, ..., 4, y – z-ből képzett szó, amely z helyett a szövegben megköveteli ennek a z-nek az első aktánsát csúcstá alakítani (z helyett) ( x = kísér, y = együtt).

AdviB (z, y), i = 1, …, 4, y megköveteli, hogy a második z aktáns legyen a csúcs (x = rossz, y = rossz).

17. Loc (x, y), y – tipikus lokalizáció (térbeli, időbeli vagy absztrakt) prepozíciója:

Locin (x, y), y – „statikus” lokalizáció (x = Moszkva, y = be);

Locad (x, y), y – irány prepozíciója (x = Moszkva, y = to);

Locab (x, y), y – az eltávolítás prepozíciója (x = Moszkva, majd y = from).

Más szavakkal, "x"y (Loc (x, y) « Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Néha a Loc(x,y) nem határozható meg egyértelműen (x = hó, y = be és y = be).

18. Copul (x, y), y – „leni”, „megjelenni” összekötő ige (x = támadott, y = támadott).

19. Oper1 (x, y), Oper2 (x, y), y – az alany szerepében lévő első (illetve második) cselekvő nevét az első objektum szerepében lévő helyzet nevével összekötő ige ( ha x = támogatás, akkor y = biztosítja az Oper1-et (x, y) és y = megtalálja vagy megfelel az Oper2-nek (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y – olyan ige, amelynek alanya a szituáció neve x alanyként és a cselekvők neve (ha van ilyen) tárgy (x = eső, y = megy).

21. Labor12 (x, y), y – az alany szerepében elsõ cselekvõ nevét, az elsõ tárgy szerepében szereplõ második cselekvõ nevével és a helyzet nevével összekötõ ige. a második tárgy szerepe (x = rend, y = jutalom; x = büntetés, y = alany).

22. Causij (x, y), y – az aktánsok cselekvése „azt tenni, hogy...”, „okozni”. A Caus (x, y) aktáns indexek nélküli esetben x a szituációban nem résztvevő neve (x = bűnözés, y = push). Külön csak az igéknél jelenik meg, más esetekben összetett paraméterek része.

23. Incep (x, y), y – „kezdeni”. A tulajdonságok ugyanazok, mint a Causij (x, y).

24. Perf (x, y), y – „tökéletes”, y a cselekvés befejezését, természetes határának elérését hordozza. A Perf (x, y)-nek nincs külön független kifejezése oroszul; Ez a predikátum általában igazra értékeli, ha y tökéletes alakban van (x = olvasott, y = olvasás).

25. Eredmény (x, y), y – „eredmény”, azaz y – „eredményként állapot...”; imperfektív formák esetén használatos (x = fekvés, y = fekvés a Perf(x, y), y = lefekvés az Eredmény(x, y) esetén).

26. Tény j (x, y), y – „megvalósítandó”, „teljesítendő”. A felső index (római számok) szükség esetén az implikált követelmény megvalósulási fokát jelöli, az alsó fokhoz alacsonyabb indexet rendelve (ha x = csapda és j = I, akkor y = trigger; ha j = II, akkor y = fogás).

27. Valós j1,2(x, y), y – „realizálja”, „teljesíti az x-ben foglalt követelményt”. A j index jelentése megegyezik a fentivel – a befejezettség foka; az alsó index azt a mély szintaktikai aktánst jelöli, amely teljesíti a követelményt (x = adósság (monetáris), y = nyugtázás a Real I1,2(x, y), y = visszafizetés a Real II1,2(x, y) esetében).

28. Destr (x, y), y – az „agresszív” cselekvés tipikus neve (x = darázs, y = csípés).

29. Cap (x, y), y – „főnök” (x = kar, y = dékán).

30. Felszerelés (x, y), y – „személyzet” (x = lakosság, y = államok).

31. Doc (x, y), y – „dokumentum”:

Docres (x, y), y – „az eredmény a dokumentum”; „megtestesítő” (x = jelentés, y = jelentés);

Docperm (x, y), y – „dokumentum a joghoz...” (x = vonat, y = (utazási) jegy a Docperm Oper2-hez (x, y));

Doccert (x, y), y – „... tanúsító okirat” (x = felsőfokú végzettség, y = diploma).

Más szavakkal, "x"y (Doc (x, y) « Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

A fent felsorolt egyszerű lexikai predikátumokon kívül ezek kombinációi – összetett predikátumok – használhatók a lexikai kompatibilitás leírására:

AntiReal2 (x, y): megbukott a vizsgán/elbukott a vizsgán;

IncepOper2 (x, y): népszerűségre tesz szert, kétségbeesik;

IncepOper2 (x, y): eladásra kerül, tűz alá kerül;

CausOper2 (x, y): ellenőrzés alá vonni, forgalomba hozni.

Amint azt korábban megjegyeztük, általános esetben a lexikális funkció nem minden szóra és kifejezésre van meghatározva. Egy függvény csak bizonyos szemantikájú szavakhoz definiálható. Például a Cap and Equip - olyan szavakra, amelyek jelentése a „főnök” és a „személyzet” jelenlétét jelenti, azaz a legtágabb értelemben vett intézmények és szervezetek nevére; Valódi – olyan szavakra, amelyek jelentése tartalmazza a „megkövetel” („szükség”) komponenst stb.

Ha a lexikális függvényeket predikátumként ábrázoljuk, akkor nem merül fel nehézség.
Azokban az esetekben, amikor a lexikális függvények nincsenek definiálva, a megfelelő predikátumok hamisak lesznek.

Különleges szerep a szemantika tanulmányozásában az I.A. megközelítésében. Melchukot a szavak vegyértéke játssza, vagyis a szavak azon képessége, hogy kapcsolatba kerüljenek más szavakkal. A helyzetet meghatározó szavaknak vegyértékük van. Ezek mind igék, néhány főnév (verbális), melléknevek (összehasonlítást jelölő: több, kevesebb, magasabb, alacsonyabb), néhány elöljárószó és határozószó.

Kétféle szóvalencia létezik: szintaktikai és szemantikai. Bár ez a felosztás néha egészen önkényes. A szemantikai vegyértékeket egy adott szó által meghatározott helyzet lexikális elemzésével határozzák meg. Mondjunk egy példát a bérlet vagy bérlet szóval. A C lízing azt jelenti, hogy bizonyos D ellenérték fejében A személy egy másik személytől B megszerzi a C ingatlan üzemeltetési jogát egy T időtartamra. Ezért a bérleti helyzet szempontjából elengedhetetlen
a következő „résztvevők” vagy szemantikai cselekvők: a lízing alanya (aki bérel), a lízing első tárgya (amit bérelnek), a szerződő fél (akitől bérel), a második tárgy (az fizetés) és a futamidő.

Ezekre az aktánsokra van szükség, hiszen bármelyikük kiiktatása megváltoztatja a helyzet értelmét. Például, ha eltávolítja a kifejezést, a bérleti helyzet adásvételi helyzetté alakul. Másrészt ezek az aktusok elegendőek, hiszen bérleti helyzetben nem kell feltüntetni, hogy milyen indokkal, hol, mikor és milyen céllal történt. Jóllehet a megfelelő szóalakok nyelvtanilag a bérel igéhez kapcsolódnak.

Más szavakkal, a szemantikai vegyértéket a szemantikai aktánsok száma határozza meg. Így a rent ige szemantikai vegyértéke 5, mivel 5 szemantikai aktánsa van. Formálisan ez a helyzet felírható P predikátumként (x1, x2, x3, x4, x5), ahol x1 „ki”, x2 „mi”, x3 „kinek van”, x4 „fizetés”, x5 a „kifejezés”.

Előfordulhat, hogy nem minden szemantikai aktáns definiálható egy mondatban, és előfordulhat, hogy néhányat egyszerűen nem említenek, vagy egyáltalán nem rendelkeznek szintaktikai kifejezéssel. A szintaktikai vegyértékeket a szövegben közvetlenül bemutatott szintaktikai aktusok (vagyis az igéhez kapcsolódó alanyok és objektumok) száma határozza meg, és a kontextustól függ.

Például a miss ige szemantikai vegyértéke 4, mivel 4 aktánsa van: ki (cselekvő), mibe/mibe (célpont), miből (fegyver - opcionális) és mivel (szerv, jelent). De a legtöbb kontextusban csak egy vegyértéket fejeznek ki szintaktikailag, például a „Sokáig célzott, de elhibázott” mondatban. A „üveggel kihagyta az ablakot” kifejezés azonban nem teljesen helytálló.

Formai szempontból az alábbiakban leírt konstrukcióval rendelkezünk. Annak érdekében, hogy ne társítsunk külön állítmányt minden igéhez (és más szavakhoz), olyan állítmányt veszünk figyelembe, amelynek mérete 1-gyel nagyobb: P val(y, x1, x2, ..., xn), míg y lesz az maga a szó, és x1, x2, ..., xn – a vegyértéke. A szintaktikai és szemantikai aktánsok megkülönböztetésére a szövegben meghatározott aktánsok jelzésére többindex használható. A bejegyzés azt jelenti, hogy az i1, i2, …, ik aktánsok meg vannak adva.
Különösen, ha minden aktáns adott, akkor megkapjuk. Előfordulhat, hogy egyes változatai (többindexes halmazok) nem érvényesek az adott nyelven. Ha az i1, i2, …, ik halmaz megengedhető, akkor az implikáció teljesül

Sőt, ha van két érvényes többindex halmaz És , úgy, hogy (i1, i2, …, ik) Ê (i1", i2", …, is"), akkor hasonló implikáció áll fenn

A magyarázó kombinatorikus szótár az I.A. egyik fő elméleti találmánya. Melchuk.
Bizonyos értelemben az I.A. által javasolt nyelvi modell. Melchuk, a nyelvet szótári bejegyzések halmazaként mutatja be, hatalmas mennyiségű változatos információval; Egy ilyen szótárban a nyelvtani szabályok inkább másodlagos szerepet töltenek be. A magyarázó kombinatorikus szótár mindenekelőtt a lexémák nem triviális kompatibilitását tükrözi. A nyelvet egy nagyon nagy modellnek tekinthetjük, amelyben lexikális predikátumok vannak meghatározva, amelyek a fent leírt módon működnek.

Egy szócikk a magyarázó kombinatorikus szótárban információkat hordoz egy adott szó vegyértékeiről, ami nem csak a szó keretén belül, hanem az egész nyelv egészére nézve is igaz. A vegyérték egy predikátumnak felel meg, ahol a cx szó szemantikai aktánsai, n a cx szó vegyértéke. Például abban a mondatban, hogy Petya könyvet olvas, cx = olvas, n = 2: y1 = Petya, y2 = könyv, vagyis feltételesen írhatjuk, hogy P val (cx, y1, y2) = 1.

Egy magyarázó-kombinációs szótár szócikkeinek halmaza az eredeti modell bizonyos almodelljének tekinthető, amely egy nyelv. A most szűkebb halmazon definiált lexikai predikátumok hasonlóan működnek.

Jelöljük F-vel az L természetes nyelv helyesen megszerkesztett frázisainak halmazát és j О F – egy frázis ebből a halmazból; – a cx szó szerepel a j kifejezésben, a cx pedig О L. Legyen cx főnév vagy melléknév. Jelöljük Predikátummal az L-en definiált predikátumok halmazát. Ennek a halmaznak az egyik eleme a korábban bevezetett P val vegyérték-predikátum (cx, y1, …, yn).

Hasonlóképpen feltételezhetjük, hogy vannak más predikátumok is:

– a Gender szó nemének állítmánya, ahol О (g1, g2, g3), g1 = nő; g2 = férfi; g3 = átlag;

– az elöljárószó állítmánya Elöljárószó, ahol Î (pr1, ..., prk) – adott szóval kombinált elöljárószavak halmaza;

– eseti állítmány Esetek, ahol – a cx szó esete; a különböző nyelveknél az esetek száma eltérő: például az orosz nyelvben hat eset van, ezért Î (eset1, eset2, eset3, eset4, eset5, eset6), eset1 = im.p.; eset2 = nem; case3 = dátum; case4 = vin.p.; case5 = kreatív; case6 = záradék; a németben négy eset van, tehát Î (eset1, eset2, eset3, eset4), ahol eset1 = Nom; case2 = Gen; case3 = dátum; eset4 = Akk.

A magyarázó-kombinációs szótár szótári bejegyzése tartalmazza a fő szót, a hozzá kapcsolódó lexikai állítmányokat, valamint a szó vegyértékére vonatkozó információkat. A vegyértékre vonatkozó információk tartalmaznak egy számot, amely jelzi az aktánsok számát, és minden aktáns esetében - annak jelzését, hogy milyen esetekben és milyen előszóval használják az aktusnak megfelelő szavakat. Egyes esetekben a szó neme is feltüntethető.

A fentiek az alak predikátumainak halmazával ábrázolhatók

ahol xi az i-edik aktánsnak megfelelő szabad változó.

A „Meaning Û Text” elméletet a kezdetektől fogva az automatikus fordítás alkalmazott problémáiban való használatra hozták létre. Az I.A. Melchuk segítségével – a hagyományos, nem szigorú elméletekkel ellentétben – biztosítani kellett egy „működő” nyelvmodell felépítését. A „Meaning Û Text” elméletet valóban használták néhány Oroszországban kifejlesztett gépi fordítórendszerben, leginkább az ETAP angol-orosz automatikus fordítórendszerben, amelyet egy Yu.D. vezette csoport hozott létre. Apresyan. Mindezek a rendszerek kísérleti jellegűek, vagyis ipari felhasználásuk nem lehetséges. Bár sok nyelvileg hasznos információt tartalmaznak, összességében egyikük sem hozott áttörést a fordítás minőségében.

A szerző véleménye szerint ennek az elméletnek az a fő értékes gondolata, hogy a szavak jelentése nem közvetlenül a környező valósággal, hanem az anyanyelvi beszélőnek erről a valóságról alkotott elképzeléseivel (ezeket néha fogalmaknak is nevezik). A fogalmak jellege az adott kultúrától függ; az egyes nyelvek fogalomrendszere alkotja az úgynevezett „naiv világképet”, amely sok részletben eltérhet a „tudományos” világképtől, amely egyetemes. A „Meaning Û Text” elméletben a szókincs szemantikai elemzésének feladata éppen a „naiv világkép” felfedezése és főbb kategóriáinak leírása. Más szóval, ennek az elméletnek az a fontos szerepe, hogy ne csak az objektív, hanem a szubjektív világképet is leírja.

Annak ellenére, hogy az érdeklődés az I.A. elmélete iránt. A Melchuk halványodik, az „Orosz nyelv nemzeti korpusza” szintaktikai korpusz jelölését az ETAP-3 nyelvi processzor végzi a „Meaning Û Text” elmélet elvei alapján.

Mint fentebb említettük, Yu.D. részt vett az ETAP processzor fejlesztésében. Apresyan. Elképzelései némileg eltérnek I.A. elképzeléseitől. Melchuk. A központi hely Yu.D. kutatásában. Apresyant egy új típusú szinonimaszótár foglalja el. Ehhez a szótárhoz egy részletes sémát dolgoztak ki a szinonim sorozatok leírására, ahol a sorozat minden elemét szemantika, szintaxis, kompatibilitás és egyéb tulajdonságok alapján jellemezték. A szótár a lehető legtöbb információt gyűjti össze és foglalja össze az orosz szinonimák nyelvi viselkedéséről.

Fogalmi függőségi diagramok

Fogalmi és esetelemzés

A szövegek morfológiai és szemantikai-szintaktikai elemzésének szakaszában a fogalmakat jelölő fő egységek a szavak. Általában úgy gondolják, hogy a kifejezések és kifejezések jelentése kifejezhető az őket alkotó szavaik jelentésén keresztül. Csak korlátozott számú stabil kifejezés – idióma – tekinthető kivételnek. Ez a megközelítés azon a feltételezésen alapul, hogy a nyelvben található szóösszetételek feloszthatók „szabad” és „nem szabad” kifejezésekre.

Egy másik megközelítés azon alapul, hogy a legstabilabb (oszthatatlan) jelentésegységek a kategóriák és a fogalmak, amelyek nem önálló szavakból, hanem kifejezésekből állnak. Az ilyen kategóriákat és fogalmakat fogalmaknak nevezzük. Ezzel a megközelítéssel a „nem szabad” kifejezések nemcsak idiomatikus kifejezések, hanem a nyelv és a beszéd összes stabil frazeológiai egysége is (a fejlett nyelvekben több százmillió van belőlük).

A fogalmi elemzés gondolata a szemantikai elemzés szerves részeként V.Sh. Rubashkin és DG. Lahuti. Ez a rész röviden felvázolja a nézeteket arról a kérdésről, hogy milyen problémákat kell megoldani fogalmi szemantikai elemzés segítségével.

A szemantikai komponens bemenetének szintaktikailag jelölt szöveget kell kapnia. A megjelölt szövegnek különféle információkat kell tartalmaznia: a szónak (kifejezésnek) megfelelő fogalmak azonosítóit; a szintaktikai gazdagép (minden alternatív gazdagép) és a szintaktikai kapcsolat típusának jelzése stb.

A szemantikai komponensre való átállás előtt a kifejezéseket, kifejezéseket is azonosítani kell, a numerikus információk megjelenítését egységesíteni, a tulajdonneveket azonosítani stb. Valós projektekben mindezeket a problémákat különböző közelítési fokokkal oldják meg. Úgy tekinthetjük, hogy a szakmai közösség legalább az alábbi kérdésekben megállapodásra jutott.

A szemantikai elemzésnek az alkalmazott módszerek és eszközök szempontjából két szakaszból kell állnia: a) a nyelvtanilag kifejezett (szintaktikai és anaforikus) összefüggések értelmezésének szakasza és b) a nyelvtani kifejezéssel nem rendelkező összefüggések felismerésének szakasza. .

A kétértelműségeket magának az elemzési folyamatnak kell feloldania - az egyes lehetőségeknél kapott eredmény szemantikai elégedettségének kritériuma szerint.

A szemantikai elemző rendszer kulcsa a hatékony szótártámogatás.
Ebben az értelemben a szemantikai elemzés bármely rendszere tezaurusz-orientált. A szemantikai elemzési eljárások kivétel nélkül minden esetben a fogalmi szótár funkcionalitásán alapulnak. A szemantikai elemzést támogató szótárnak jelentésekkel kell működnie, és ezért nem szavak, hanem fogalmak tulajdonságait és kapcsolatait kell leírnia. Ez egy fogalmi szótár. A fogalmi szótár szerepét bizonyos értelemben szemantikai hálózatok is betölthetik, amelyeket a következő részben ismertetünk.

A szemantikai értelmezőben mindenekelőtt meg kell határozni a szövegben megkülönböztethető szemantikai viszonyok típusait: szerep (az állítmány vegyértéke szerinti kapcsolatok), alany-asszociatív (tárgyak, folyamatok közötti kapcsolatok, az alanyban szignifikáns). terület - résznek lenni, helynek lenni, célnak lenni, fővárosnak lenni stb.) stb.

A szintaktikai összefüggések értelmezéséhez a következő alapvető posztulátumokat fogadjuk el.

1. A létrejövő szemantikai kapcsolat típusát szemantikai osztályok és osztályok határozzák meg
bizonyos esetekben a szintaktikai „mester” és „szolga” részletesebb szemantikai jellemzői.

2. Az elöljárószavakat nem önálló értelmezési tárgynak tekintjük, hanem az elöljárószó szintaktikai „tulajdonosa” és az általa irányított szignifikáns szó közötti kapcsolat további (szemantikai-grammatikai) jellemzőjének.

3. Az elemző által rögzített lexikai és szintaktikai homonímia feloldásához a szemantikai értelmező empirikusan megállapított preferenciarendszert használ. Az értelmezési lehetőségek preferenciáinak könnyebb összehasonlítása érdekében számszerű rangsort kapnak. A szemantikai kapcsolatok típusainak szintjén a következő preferencia-sorrend jön létre (a felsorolás sorrendje a kapcsolat prioritásának csökkenésének felel meg):

– funkcionális és a szemantikai redundancia tényét megállapító kapcsolatok;

– kötelezőként meghatározott szerepkapcsolatok szemantikailag konzisztens aktáns jelenlétében;

– magreferencia kapcsolatok;

– választhatóként meghatározott szerepkör kapcsolatok;

– alany-asszociatív kapcsolatok megadása;

– az alany-asszociatív kapcsolatok nem meghatározottak.

Meghatározott szintaktikai kapcsolatok azok, amelyeket az értelmező képes lexikalizálni egy adott relációval a tárgykörben (kikötői létesítmények ® a kikötőben található struktúrák); Ennek megfelelően a meghatározatlan kapcsolatok azok, amelyekre az értelmező nem tud ilyen specifikációt kínálni, és amelyeket az összekapcsolás általános fogalma értelmez.

Ha a koordináló kapcsolatok szintaktikai homonímiáját észleljük, a preferenciákat a szintaktikai kapcsolat résztvevőinek szemantikai jellemzőinek konzisztenciája határozza meg.

A lexikai és a lokális szintaktikai kétértelműségeket (alternatív gazdagépek jelenléte egy szóhoz) egyetlen felsorolási mechanizmusban dolgozzák fel. A mondat elemzésének globális lehetőségeit a következő szintű felsorolási mechanizmus veszi figyelembe. Ebben az esetben az összes mondatkapcsolat összesített értelmezési súlyát hasonlítjuk össze.

A különböző típusú kapcsolatok létesítésekor az értelmezést a következő rendelkezések határozzák meg.

A szerepkapcsolatok kialakításakor a szintaktikai kapcsolat résztvevőinek alábbi nyelvtani jellemzői jelentősek és figyelembe kell venni (az orosz nyelv vonatkozásában):

– az állítmány szemantikai-szintaktikai típusa (szótári jellemző);

– az állítmány nyelvtani alakja;

– cselekvő eset, egy adott vegyérték szerinti jelzői alak lehetősége egy aktusra;

– az aktáns prepozíciós vezérlésének lehetősége és a szintaktikai kapcsolatot alkotó elöljárószó adott vegyérték szerinti kapcsolat kifejezésére való képessége; A prepozíció szótári leírása tárolja azt az információt, hogy egy elöljárószó egy adott vegyérték szerepjelzőjeként szolgálhat-e.

Működésileg egy cselekvő lehetséges szerepének meghatározására szolgáló eljárást a szerepkapcsolatok nyelvtana határozza meg, megállapítva a típus megfelelését.

(Rf, GFP, TSEMU) ® VAL,

ahol Rf a szintaktikai kapcsolat neve; GFP – az állítmány nyelvtani alakja; TSEMU – az állítmány szemantikai-szintaktikai típusa; A VAL egy lehetséges vegyérték neve vagy hivatkozás az elöljárószó szerepfüggvényére.

Ezután ellenőrizzük, hogy az aktáns szemantikai jellemzői megfelelnek-e az predikátum vegyértékének kitöltésének szemantikai feltételének (ellenőrizzük a megfelelő fogalompár térfogati kompatibilitását).

Korreferencia-reláció létrehozásához a következő feltételek szükségesek és elegendőek:

– a „mester” és a „szolga” az objektum szemantikai kategóriájába tartozik;

– az „úr” és „szolga” kifejezéseknek megfelelő fogalmak térfogati kompatibilitási viszonyban állnak;

– prepozíciós kapcsolat esetén az adott elöljárószó korreferencia-reláció kifejező képességét ellenőrzik.

A meghatározott alany-asszociatív kapcsolatok kialakításához a következő feltételek szükségesek és elegendőek:

– az „úr” és a „szolga” kifejezéseknek megfelelő fogalmak térfogati összeférhetetlenségi relációban állnak, vagy (ha kompatibilisek) e kifejezések szintaktikailag olyan elöljárószón keresztül kapcsolódnak egymáshoz, amely nem képes a korreferencia viszonyának kifejezésére;

– az „úr – szolga” kifejezéspárral valamilyen alanyi viszony lexikailag asszociálódik
(<автомобиль, кузов>® van egy rész) és/vagy (ha a kapcsolat prepozíciós) az alanyi reláció elöljárószóhoz és esethez kapcsolódik.

A meghatározatlan alany-asszociatív viszonyok megállapításához szükséges és elegendő az első feltétel igazsága és a második feltétel hamissága.

Egyre fontosabbá válik az előre felcímkézett szövegekből álló korpusz felhasználásán alapuló "minta szerinti" elemzés (precedens elemzés). Egy ésszerűen felépített elemzőrendszernek nemcsak az ismeretek kinyerését kell biztosítania egy adott szövegből, hanem az eredmények felhalmozódását is mind szintaktikai, mind szemantikai szinten – ezek további precedensként való felhasználására.

A jelenleg megvalósuló egyik legnagyszabásúbb és legjelentősebb projekt az Orosz Nyelvi Nemzeti Korpusz létrehozása. Moszkvából, Szentpétervárról, Kazanyból, Voronyezsből, Szaratovból és más oroszországi tudományos központokból nyelvészek nagy csoportja vesz részt benne.

Az Orosz Nyelv Nemzeti Korpusza kiterjedt nyelvi és metatextuális információkkal ellátott elektronikus szövegek gyűjteménye. A korpusz a 19–20. századi orosz nyelv stílusainak, műfajainak és változatainak teljes változatát reprezentálja. Az Orosz Nyelv Nemzeti Korpusza jelenleg ötféle jelölést használ: metatextuális, morfológiai (inflexiós), szintaktikai, hangsúlyos és szemantikai jelölést. Nem vizsgáljuk meg részletesen az összes rendelkezésre álló jelöléstípust, csak a szemantikai jelölésekre fogunk összpontosítani.

A szemantikai jelöléssel a szöveg legtöbb szava egy vagy több szemantikai és szóképző jellemzőt kap, például „személy”, „anyag”, „tér”, „sebesség”, „mozgás” stb. automatikusan kilép a Semmarkup programmal (szerző A.E. Polyakov) a korpusz szemantikai szótárának megfelelően. Mivel a szemantikailag címkézett szövegek kézi feldolgozása nagyon munkaigényes, a szemantikai homonímiát a korpuszban nem távolítják el: több alternatív szemantikai jellemzőkészletet rendelnek a poliszém szavakhoz.

A szemantikai jelölés a Lexicograph adatbázisban elfogadott orosz szókincs osztályozási rendszerén alapul, amelyet 1992 óta fejlesztettek ki a VINITI RAS Nyelvészeti Kutatási Osztályán E.V. vezetésével. Paducheva és E.V. Rakhilina. A korpusz esetében jelentősen bővítették a szókincset, bővítették az összetételt és javították a szemantikai osztályok szerkezetét, valamint szóalkotási jellemzőket adtak hozzá.

A szemantikai szótár szókincse a „Tárcsázás” rendszer morfológiai szótárán alapul (összesen körülbelül 120 ezer szó), amely az orosz nyelv nyelvtani szótárának kiterjesztése A.A. Zaliznyak. A szemantikai szótár jelenlegi változata a beszéd jelentős részeinek szavait tartalmazza: főnevek, melléknevek, számnevek, névmások, igék és határozószók.

A szövegben egy tetszőleges szónak tulajdonított lexiko-szemantikai információ három jelcsoportból áll:

– kategória (például tulajdonnév, visszaható névmás);

– aktuális lexikális-szemantikai jellemzők (például egy lexéma tematikus osztálya, oksági jelek, értékelések);

– származékos (szóképző) jellemzők (például „kicsinyítő”, „melléknévi határozószó”).

A lexiko-szemantikai információ a beszéd különböző részeihez eltérő szerkezettel rendelkezik. Ezen túlmenően a főnevek mindegyik kategóriája - tárgyi, nem tárgyi és tulajdonnevek - saját főnévi szerkezettel rendelkezik.

A tényleges lexikális-szemantikai jelek a következő mezőkbe vannak csoportosítva:

– taxonómia (lexéma tematikus osztálya) – főnevekre, melléknevekre, igékre és határozószókra;

– mereológia (a „rész – egész”, „elem – halmaz” kapcsolat megjelölése) – objektív és nem tárgyi nevek esetén;

– topológia (a kijelölt objektum topológiai állapota) – alanyneveknél;

– okozati összefüggés – igéknél;

– szolgáltatási állapot – igéknél;

– értékelés – tárgyi és nem tárgyi jellegű nevekre, melléknevekre és határozószavakra.

Az igék tematikus osztályai

E. V. tanulmányait az orosz nyelv szemantikája tanulmányozásának speciális irányának tekintik. Paducheva. A legérdekesebbek az orosz igék tematikus osztályaival kapcsolatos munkák. A tematikus osztály a szavakat egy közös szemantikai összetevővel kombinálja, amely a szemantikai szerkezetükben központi szerepet játszik. Vannak például fázisigék, észlelés igék, tudás igék, érzelmek igék, döntési igék, beszédigék, mozgás, hang igék, egzisztenciális igék stb.

Az azonos tematikus osztályba tartozó szavaknak van néhány nem triviális közös értelmezése. A tematikus osztály több okból is fontos. Először is, egy tematikus osztálynak gyakran vannak jellegzetes megnyilvánulásai a szintaxisban – például egy osztálynak általában van egy jellegzetes tagja.
Másodszor, ugyanannak a tematikus osztálynak a tagjai általában ugyanazzal a szemantikai származékhalmazzal rendelkeznek, vagyis a tőle függő fogalmakkal.

A cikk a tökéletlen igék privát vonatkozású jelentéseinek legteljesebb listáját tartalmazza. A következő jelentéstípusokat különböztetjük meg: tényleges-hosszú távú (a folyamat vagy állapot a megfigyelés időpontjában tart); folyamatszerű (vagyis egyszerűen folyamatos); állandó-folyamatos (egy állandó tulajdonság vagy kapcsolat jelentése); szokásos (a szokásos jelentése, azaz egy általánosan elfogadott, ismétlődő cselekvés vagy esemény); lehetséges; többszörös (de nem szokásos vagy potenciális); általános tényszerű korlátlan (leállított állapot vagy korlátlan folyamat jelentése); általános tényszerű hatékony (a cselekvés elérte a határát); általános tényszerű kétirányú (az eredményt sikerült elérni, de egy ellentétes irányú cselekvés megsemmisítette); általában tényszerűen hatástalan (nem ismert, hogy a cselekvés elérte-e a határát).

A mű állítmányneveket, azaz igékből és melléknevekből képzett főneveket elemzi, mint a küzdelem, jövés, kétségbeesés, fösvénység. Ennek eredményeként lehetséges a folyamatok, események, állapotok és tulajdonságok megkülönböztetése.

Például a folyamatnevek elfogadhatók olyan igék kontextusában, amelyek jelentése „folyni”, „menni”, azaz „megtörténik” (beszélgetés zajlik, sztrájk zajlik, frissítés történik hely). A folyamatok egy sajátos fajtája a folyamatos cselekvés, vagyis a céltudatos folyamatok egy aktív témával, mint például a harc, az ellenőrzés, de nem az úszás, a menekülés, a lázadás, a séta, az alvás, a dohányzás. Az akciónevek elfogadhatók a „termel”, „végrehajtás” jelentésű igék kontextusában: a megfigyelést ügynökök csoportja végezte; fogadást végeznek (pótlás, szelekció); nyomozunk.

A folyamatok minden megnevezése a „kezdeni”, „vége”, „folytatás” jelentésű fázisigék kontextusában használatos: a küzdelem elkezdődött (eső, csata); véget ért a másként gondolkodók üldözése; A partraszállás (ostrom) folytatódik. A cselekvésnevek elfogadhatók a „kezdés”, „vége”, „folytatás” jelentésű fázisigék kontextusában: tárgyalásokat folytattak; befejezte a jegyzetfüzetek ellenőrzését; megszakított olvasás; elindult, elindult, leállt (kiadás). A fázisigekontextus a folyamatnevek diagnosztikája, szemben az eseménynevekkel.

Az eseményneveket a „megtörtént”, „megtörtént” jelentésű igék kapcsán használjuk: földrengés történt. Az események abban különböznek a folyamatoktól, hogy van visszamenőleges megfigyelőjük. A folyamat megfigyelője szinkron, ezért ha van folyamatunk, akkor az ige tökéletlen, ha pedig eseményünk van, akkor tökéletes.

A folyamatok, események, állapotok és tulajdonságok közötti különbségekkel kapcsolatban sok egyéb részletet kihagyunk, kivéve, hogy megjegyezzük, hogy ezeknek a tanulmányoknak az alkalmazási lehetőségeit még felfedezni kell.

Az alábbiakban felsoroljuk azokat az észlelési igéket, amelyeket E.V. Paducheva az egyik legalaposabban tanulmányozott tematikus osztály. Úgy tűnik, hogy annak megállapításához, hogy egy ige az észleletek tematikus osztályába tartozik, elegendő megbizonyosodni arról, hogy a szemantikai képlete tartalmazza az „észlelés” komponenst. Azonban nem minden ilyen egyszerű. Az a tény, hogy az észlelési komponens könnyen beépül a különböző osztályok igék szemantikájába. A valódi észlelés a mentális észlelésbe áramlik.

1. Mozgás és állapot igék, amelyek megfigyelőt feltételeznek:

a) megfigyelt mozgás igék: villan, villan, megjelenik, csúszik;

b) a megfigyelt állapot igék: kifehéredik, kilóg, szövőszék; szétterül, kilóg, kitör, szétterül, megnyílik, előad;

c) fény-, szag-, hangkibocsátás igék: ragyog, villog, izzik, szagol, bűz, hang.

2. A hallani ige sugalmazza a szemlélőt (mint a harangszóban), de a következő igéknek is van észlelési összetevője: megtorpan, tompítani, beárnyékolni, elhallgatni, elhallgatni, alábbhagy, tompítani összeolvadnak (mint a tunikában és a szürke nadrágban szinte összeolvadtak a talajjal).

3. Az észlelés alanya (vagy megfigyelő) a kauzatív igék által kifejezett helyzetek kötelező résztvevője: kifejezni, megmutatni (megmutatta vonzalmát); kiemelni, feltárni, árnyékolni, kiemelni, elfogni, kitakarni, kitenni, megjelölni (szegélyeket), kinyitni, megjelölni, megjeleníteni; és dekauzatívumaik (kifejezni, felfedni, kitűnni, lenyomni, leleplezni, azonosítani, megnyitni).

4. Számos ige írja le az azonosítást, amihez az érzékszervek részvétele szükséges: azonosít, megkülönböztet, felismer, megkülönböztet, azonosít, megkülönböztet (körvonalaz), felismer, kitalál (mint a második betűt nem értem).

5. Sok ige tartalmaz perceptuális komponenst, de nagyon konkrét cselekvést vagy tevékenységet jelöl, amelynek a cél a fő, és nem az észlelés részvétele annak elérésében: megvizsgál ("ellenőrzést végez"), regisztrál, keres , megtalálni, megtalálni, felkutatni, felfedezni, ábrázolni, körvonalazni, nyomon követni, nyomon követni, őrizni, lesben állni, megvilágítani, elrejteni, elrejteni, kémkedni.

6. Az információt továbbító és fogadó bármely ige, például írni vagy olvasni, feltételezi egy jel jelenlétét, amelyet érzékszervekkel kell felfogni.

7. A mutat és elrejtő igék, mivel értelmezésükben perceptuális komponens is szerepel, szintén az észlelés igék közé sorolhatók.

8. Az észlelés igéi közé tartozik többek között a blind - go blind (és vak az egyik jelentésben). Leírják a látószerv elvesztését, ami a látás képességének örökre elvesztését eredményezi. Ez azonban nem tartalmazza az ébredni igét, amely az észlelési képesség átmeneti elvesztését jelöli a későbbi visszatéréssel.

9. Az érzékelés néhány stílusosan színezett igéje: bámul, bámul, kikel, bámul, bámul, lát, elkap, világít.

10. A tematikus osztályozást a szavak eredeti jelentései vezérlik. Eközben sok ige származékként észlelési jelentéssel bír; különösen figyelni, szembenézni (problémával), behatolni (titkába), megszólalni. Például fehér épületek hirtelen előbukkantak a sötétségből.

11. Egyéb hasonló szavak, amelyekben az észlelés jelentése származékos vagy kontextuálisan meghatározott, mint például dob (néz, néz), rohan (a szemekbe), fordul (néz, figyel), átfut (szem), kábult (néz) , csúszik (nézd ).

12. Megjelölt cselekvési módok igéi:

a) kezdete: átmutatni, kifehéredni, megszólalni;

b) fifinitivusok: nézni, hallgatni és kémkedni, kihallgatni;

c) telítő: eleget nézni, eleget csodálni, eleget hallgatni;

d) teljes felszívódású igék a cselekvésben: nézni - nézni, nézni - nézni;

e) különösen hatásos: figyelj - vigyázz, nyom - nyom le, nyom - nyom;

f) szakaszosan lágyulás: néz, figyel; semelfactive: nézd.

Az észlelési igéknek, más tematikus osztályokhoz hasonlóan, megvannak a saját szemantikai levezetési modelljeik, amelyek erre az adott osztályra jellemzőek.

13. Jellemző a szemantikai átmenet - az észleléstől a mentális jelentésig. Származott mentális jelentés alakul ki például a lát, néz, észrevesz, mérlegel igékben (sugalmaként; és mérlegeljük a mondatodat), érezni, látszani, felfedezni, hallani, elképzelni, találkozni, követni, megjelenni; mutatkozz be, látogasd meg egymást (ugyanaz a kétértelműség a kinézet főnévnél):

a) A pultról jól rálátott a klub tornácára (vizuális jelentés);

b) Én így látom (mentális jelentés).

14. A tanúskodni ige etimológiailag látást sugall, de az Ez rendkívüli tehetségéről tanúskodó szövegkörnyezetben mentális jelentéssel bír; fényt vetni azt jelenti, hogy „tisztábbá teszünk”, bár fényre van szükség a látáshoz. A várni ige általában elvesztette az ízérzékeléshez kapcsolódó összetevőt, és mentálissá vált.

15. A származtatott mentális jelentés a kauzatív igékben is előfordul. Tehát a show az észlelés ige, de lehet „bizonyítani”, mentális jelentése is. Érdekes, hogy a lásd származékai között mind a tudás, mind a vélemény igék vannak:

a) Látom, hogy hallgat (tudás);

b) ezt akadálynak (véleménynek) tekinti.

16. A megjelenni ige ötvözi az észlelési jelentést (Nem volt ott) a mentális jelentéssel (Kiderült, hogy egészséges).

17. A beszéd származékos jelentése fejleszti az észrevenni igét; határozószókkal kombinálva nyilvánul meg: helyesen vetted észre („helyesen mondtad”).

18. A hallgat, figyel, engedelmeskedik, figyel igékre az „észlelés” - „bevet” kétértelműsége jellemző.

19. A szemantikai átmenet look ® relate is szabályos, azaz ismétlődő: egyszerűen nézem (egyszerűen kezelem); hunyd le a szemed (kényeztesse magát); annak ellenére (attól függetlenül).

20. A look ® relate többértelműsége a kancsal igére jellemző: a) (oldalra néz, oldalról); b) (ferde pillantás, gyanakvó bánásmód, gyanakvó magatartást egy pillantással kifejezni).

21. A see ® have átmenetet a megtalálni, elveszteni példák képviselik.

22. Az észlelésből az interperszonális érintkezésbe való átmenetet a találkozni, nézni (a fényre), egymást látni igék jelzik.

23. A látás értelme elhalványulhat egy tárggyal való egyszerű érintkezés gondolatává, vagyis egy helyen lenni (ezek a falak sokat láttak; Krím mindig örülni fog, ha látlak).

24. A megjelenni és eltűnni igéket a láthatónak lenni - létezőnek kétértelműsége jellemzi. Hasonló kétértelműség van a denotátumban – denotálni kell; eltévedni: például az Ösvény elveszett a bokrok között (megszűnt) és a mozgások élénksége fokozatosan elveszett (megszűnt); a tökéletes fajnak van egy szakadéka (bár a tökéletlen fajok számára az eltűnés csak azt jelenti, hogy nem látható: hol voltál?). A matematikai nyelvben, ha létezik X, akkor X létezik.

25. Az észlelés szemantikai fogalma gyakran együtt él a mozgással: ütközik, megbotlik, belefut, belefut; elkapni (kaptam egy fehér gombát).

A mozgás következménye lehet éppen ellenkezőleg, a látómező elhagyása, mint az elrejtőzés, szökés, sérülés.

Érdekes, hogy az észlelés főbb típusait - látás, hallás, szaglás, tapintás, íz - kifejező igék esetében az eredeti lexéma szemantikai származékainak egyetlen paradigmája azonosítható, és ez sok nyelvre lényegében ugyanaz lesz, ami e szókincs és adattervek ősiségét jelzi.

Ebben a megközelítésben elengedhetetlen az az elképzelés, hogy a nyelvi fogalmakat bizonyos szemantikai csoportokra osztják, figyelembe véve azt a tényt, hogy ezeknek a fogalmaknak van néhány nem triviális közös szemantikai összetevője. Az ilyen csoportok elemei általában ugyanazokkal a függő fogalmakkal rendelkeznek. A szemantikai elemzést támogató szótárnak jelentésekkel kell működnie, és ezért nem szavak, hanem fogalmak tulajdonságait és kapcsolatait kell leírnia. Továbbra is kérdés, hogyan lehet helyesen strukturálni és bemutatni az információkat az ilyen szótárakban úgy, hogy kényelmes és gyors legyen a keresés, és emellett figyelembe lehessen venni a természetes nyelv változásait (a régiek eltűnése és új fogalmak megjelenése). ).

A szemantikai problémák tárgyalásakor gyakran kerül szóba a kompozíciós elv. Azt állítja, hogy egy összetett kifejezés jelentését az alkotórészeinek jelentése és az ezek kombinálására alkalmazott szabályok határozzák meg. Mivel egy mondat szavakból áll, kiderül, hogy jelentése a benne foglalt szavak jelentéshalmazával ábrázolható. De ez nem ilyen egyszerű. A mondat jelentése támaszkodik a szórendre, a megfogalmazásra és a mondatbeli szavak közötti kapcsolatokra is, vagyis figyelembe veszi a szintaxist.

Amint látjuk, a fogalmi függőségi diagramok arra utalnak, hogy bizonyos esetekben sérül a kompozíciós elv. Tévedés azt állítani, hogy a kifejezések és kifejezések jelentése az őket alkotó szavaik jelentésén keresztül fejezhető ki. Ez nem mindig igaz. Ezzel a megközelítéssel azonban az a fő probléma, hogy a tematikus osztályok azonosítása és a szemantikai szótárak összeállítása rendkívül munkaigényes folyamat, amely nagymértékben függ az adott személy egyéni felfogásától és értelmezésétől.

A tudásreprezentáció hálózati modelljei

Tezauruszok, szemantikai hálózatok, keret és ontológiai modellek

A tezaurusz egyfajta általános vagy speciális szókincs szótár, amely a lexikai egységek közötti szemantikai kapcsolatokat jelzi. A magyarázó szótártól eltérően a tezaurusz nemcsak definíción keresztül teszi lehetővé a jelentés beazonosítását, hanem a szó más fogalmakkal és azok csoportjaival való összefüggésbe hozását is, aminek köszönhetően felhasználható a mesterséges intelligencia rendszerek tudásbázisainak kitöltésére.

A tezauruszok általában a következő alapvető szemantikai kapcsolatokat használják: szinonimák, antonimák, hiponimák, hiperonimák, meronimák, holonimák és paronimák.

A szinonimák ugyanazon beszédrész szavai, amelyek hangzásban és helyesírásban különböznek, de hasonló lexikális jelentéssel bírnak (bátor - bátor, rettenthetetlen).

Az antonimák ugyanazon beszédrész szavai, amelyek hangzásban és helyesírásban különböznek, és közvetlenül ellentétes lexikális jelentésük van (jó - gonosz).

A hiponima olyan fogalom, amely egy adott entitást egy másik, általánosabb fogalomhoz (állat - kutya - bulldog) viszonyítva fejez ki.

A hipernim tágabb jelentésű szó, általános, általános fogalmat, tárgyak, tulajdonságok vagy jellemzők osztályának elnevezése (bulldog - kutya - állat).

A hipernima egy logikai általánosítási művelet eredménye, míg a hiponima egy korlátozás.

A Meronym egy olyan fogalom, amely egy másik (autó - motor, kerék, motorháztető) szerves részét képezi.

A Holonym egy olyan fogalom, amely teljesen felülmúlja a többi fogalmat (motor, kerék, motorháztető - autó).

A meronímia és a holonímia mint szemantikai reláció kölcsönösen inverzek egymással, akárcsak a hiponímia és a hiperonímia.

A paronimák olyan szavak, amelyek formájukban hasonlóak, de jelentésükben eltérőek (indiai - indiai).

A tezaurusz például a WordNet. A WordNet alapvető szókincsegysége egy szinonim sorozat (synset), amely hasonló jelentésű szavakat kombinál. A szinkészletek olyan szavakból állnak, amelyek ugyanahhoz a beszédrészhez tartoznak, mint az eredeti szó. Minden synsethez tartozik egy kis utasítás (definíció), amely elmagyarázza a jelentését. A szinkészleteket különféle szemantikai kapcsolatok kötik össze, például hiponímia, hiperonímia stb. Az 1. ábrán látható egy példa a toll (toll) szóra. Látható, hogy a szótárban ennek a szónak öt különböző jelentése van az íróeszközök kategóriájába tartozik, és hét kapcsolódó szava van: ceruza, jelölő, táblakréta, viaszkréta stb.

A WordNet körülbelül 155 ezer különböző lexémát és kifejezést tartalmaz, 117 ezer szintkészletbe rendezve. A teljes adatbázis három részre oszlik: főnevekre, igékre és melléknevekre/határozószavakra. Egy szó vagy kifejezés több szintkészletben is szerepelhet, és a beszéd egynél több részkategóriájába is tartozhat. A WordNet adatbázisban található egyedi szavak, szintkészletek és szó-szintkészlet párok számáról az 1. táblázatban található részletesebb információ.

A WordNet előnyei más hasonló erőforrásokkal szemben a nyitottság, a hozzáférhetőség és a nagyszámú különböző szemantikai kapcsolat jelenléte a synsetek között. A WordNet közvetlenül egy böngészővel (helyben vagy az interneten keresztül) vagy C-könyvtárak segítségével érhető el.

Vannak WordNet-megvalósítások más nyelvekhez (körülbelül 16). Például az EuroWordNet európai nyelvekhez készült, amelynek különböző nyelvi változatai közötti kapcsolat egy speciális nyelvközi indexen keresztül történik. A WordNet az orosz nyelvre is fejlesztés alatt áll. Meg kell jegyezni, hogy léteznek módszerek a WordNet szinkészletek tárgyi osztályozására, azaz meghatározzák azokat a tudásterületeket, amelyeken használják őket. Az ilyen információk a későbbiekben a szavak lehetséges jelentéseinek számának csökkentését szolgálhatják, ha a feldolgozott dokumentum tárgya ismert, ezáltal lehetővé válik egy szó hibás jelentésének elfogadása esetén a hiba értékének csökkentése.

A szemantikai hálózat egy tárgyterület modellje, amely irányított gráf formájú, amelynek csúcsai megfelelnek a tárgyterület objektumainak, az ívek (élek) pedig a köztük lévő kapcsolatokat határozzák meg. Az objektumok lehetnek fogalmak, események, tulajdonságok, folyamatok. A szemantikai hálózat tehát a tárgykör szemantikáját tükrözi fogalmak és kapcsolatok formájában. Ezenkívül a fogalmak lehetnek objektumok példányai vagy halmazaik.

A szemantikai hálózatok matematikai képletek megjelenítésére tett kísérletként jelentek meg. A szemantikai hálózat gráf formájú vizuális megjelenítése mögött egy olyan matematikai modell áll, amelyben minden csúcs a tárgyhalmaz egy elemének, egy ív pedig egy predikátumnak felel meg. A 2. ábra a Wikipédiából vett szemantikus webre mutat példát.

Az ezen a területen használt terminológia változatos. Bizonyos homogenitás elérése érdekében az ívekkel összekötött csomópontokat általában gráfoknak nevezik, és azt a struktúrát, ahol csomópontok egész fészke van, vagy ahol a gráfok között különböző sorrendű kapcsolatok vannak, hálózatnak nevezzük. A magyarázathoz használt terminológia mellett az ábrázolás módjai is eltérnek. Néhányan köröket használnak téglalapok helyett; egyesek ívek fölé vagy alá írnak relációtípusokat, bezárva vagy nem oválisba zárva; egyesek olyan rövidítéseket használnak, mint az O vagy A egy ügynök vagy objektum jelölésére; egyesek különböző típusú nyilakat használnak.

A legelső szemantikai hálózatokat a gépi fordítórendszerek közvetítő nyelveként fejlesztették ki. A szemantikus hálózatok legújabb verziói egyre erősebbek és rugalmasabbak, és versenyeznek a keretrendszerekkel, a logikai programozással és más tudásreprezentációs nyelvekkel.

Az eltérő terminológia, az általános és létező kvantorok és logikai operátorok reprezentációs módszereinek sokfélesége, a hálózatok manipulálásának és a következtetési szabályok eltérő módjai ellenére szinte minden szemantikai hálózatban jelentős hasonlóságokat azonosíthatunk:

– a szemantikai hálózatok csomópontjai objektumok, események, állapotok fogalmait reprezentálják;

– ugyanazon fogalom különböző csomópontjai különböző értékekre vonatkoznak, kivéve, ha ugyanahhoz a fogalomhoz tartozóként vannak megjelölve;

– a szemantikai hálózatok ívei kapcsolatokat hoznak létre a fogalomcsomópontok között, az ívek feletti jelek jelzik a kapcsolat típusát;

– egyes fogalmak közötti kapcsolatok szemantikai szerepeket képviselnek, például „ügynök”, „objektum”, „címzett” és „eszköz”; mások időbeli, térbeli, logikai és egyes mondatok közötti kapcsolatokat jelentenek;

– a fogalmak az általánosság foka szerint szintekbe vannak rendezve, hasonlóan a WordNet hiperonimák hierarchiájához, például entitás ® élőlény ® állat ® húsevő.

Megjegyzendő, hogy a hálózatok leírására használt szemantikai relációk között nem csak a tezauruszban használt szemantikai relációk lehetnek, hanem más típusú kapcsolatok is: funkcionális (általában a produkál, befolyásol, ... igék határozzák meg), kvantitatív (több mint, kisebb, mint, egyenlő, ... ), térbeli (távol, közel, alatt, felett, ...), időbeli (korábban, később, közben, ...), attributív (van tulajdonsága, van értéke ), logikai (ÉS, VAGY, NEM) stb.

Például az Ivanovnak fekete BMW-je mondat szemantikája a 3. ábrán látható szemantikai hálózat formájában ábrázolható.

Néhány különbség ellenére a hálózatok számítógéppel könnyen olvashatók és feldolgozhatók, és vizuális és meglehetősen univerzális eszközök a természetes nyelv szemantikájának megjelenítésére. A tudás reprezentációjának, felhasználásának és módosításának konkrét modelljeiben való formalizálásuk azonban meglehetősen munkaigényesnek bizonyul, különösen az elemek közötti többszörös kapcsolat jelenlétében.

Vegyünk például egy hálózatot, amely leírja, hogy Nastya könyvet kért Dashától. Tegyük fel, hogy tulajdonságokat tulajdoníthatunk az adott tárgyaknak: Nastya – „szorgalmas”, Dasha – „érdeklődő”. Ezek között a tárgyak között van kapcsolat (a könyvön keresztül). De ezen kívül sok más kapcsolat is létezik a való világban: társadalmi státusz (diákok, barátnők – nem feltétlenül egymás között), családi kapcsolatok (mindegyiknek vannak szülei és/vagy más rokonai) stb. Kiderült, hogy még egy ilyen egyszerű példa esetében is a hálózat nagyra nőhet, és ennek eredményeként a kimenet keresése túl nehéz lesz.

Az összetett szemantikai hálózatokban, amelyek sok fogalmat tartalmaznak, a csomópontok frissítésének és a köztük lévő kapcsolatok figyelésének folyamata, amint látjuk, bonyolítja az információfeldolgozási eljárást. A hiányosságok megszüntetésének vágya speciális szemantikai hálózatok, például keretmodellek megjelenéséhez vezetett.

A tudásreprezentáció keretmodelljeit M. Minsky javasolta.

A keret egy fogalom vagy helyzet leírására szolgáló struktúra, amely a helyzet jellemzőiből és azok jelentéséből áll. A keretet egy szemantikai hálózat töredékének tekinthetjük, amelynek célja fogalmak leírása a benne rejlő tulajdonságok teljes halmazával együtt. A tudásreprezentáció keretmodelljeinek sajátossága, hogy a modell egyes csomópontjaiban leírt fogalmakat attribútumok és azok értékei határozzák meg, amelyeket a keret rései tartalmaznak.< имя фрейма, слот 1, слот 2, …, слот N >. Grafikailag ez a szemantikai hálózathoz hasonlít, de az alapvető különbség az, hogy a keretmodell minden csomópontja általánosított szerkezettel rendelkezik, amely sok időrésből áll, amelyek mindegyikének van neve, öröklődési mutatója, adattípus-mutatója és értéke. .

A slot egy keret alapú modellben lévő csomóponthoz társított attribútum, amely egy keret része. A helynévnek egyedinek kell lennie a kereten belül. Az öröklődési mutató jelzi, hogy a legfelső szintű keretben lévő helyekre vonatkozó attribútum-információkat öröklik az alacsonyabb szintű keretben lévő azonos nevű helyek. Az adattípus-jelző információkat tartalmaz a foglalatban lévő adatok típusáról. Általában a következő adattípusokat használják: mutató a legfelső szintű keret nevére, valós szám, egész szám, szöveg, lista, táblázat, csatolt eljárás stb. A slot értéke lehet attribútumpéldány, másik keret vagy aspektus, és meg kell egyeznie a megadott adattípussal és feltétel öröklődésével. Egy adott érték mellett egy slot olyan eljárásokat és szabályokat is tárolhat, amelyeket akkor hívnak meg, amikor az érték kiszámításához szükséges. Így egy slot nem csak egy konkrét értéket tartalmazhat, hanem egy eljárás nevét is, amely lehetővé teszi annak kiszámítását egy adott algoritmussal, valamint egy vagy több szorzatot, amelyek segítségével ez az érték meghatározásra kerül. Egy slot több értéket is tartalmazhat. Néha ez a rés tartalmaz egy facet nevű összetevőt, amely megadja a lehetséges értékek tartományát vagy listáját. A aspektus a rés kitöltési határértékeit is meghatározza. Az információk hozzáadására és törlésére szolgáló eljárások leggyakrabban a résekhez vannak társítva, amelyek nyomon követhetik az információk adott csomóponthoz való hozzárendelését, és ellenőrizhetik, hogy megtörténnek-e a megfelelő intézkedések, amikor az érték megváltozik.

Vannak a tudásbázisban tárolt minta keretek (prototípusok), illetve példánykeretek, amelyek a bejövő adatok alapján valós helyzetek megjelenítésére jönnek létre. A keretmodellek meglehetősen univerzálisak, mivel lehetővé teszik, hogy a világról szóló ismeretek teljes sokféleségét tükrözze keretstruktúrákon (tárgyak és fogalmak jelölésére: kölcsön, zálog, számla), keretszerepek (menedzser, pénztáros, ügyfél), kereteken keresztül. -forgatókönyvek (csőd, részvényesek értekezlete, névnapi ünnepségek), kerethelyzetek (riasztás, baleset, készülék üzemmód), stb. A tudás kerethálózat formájában történő megjelenítéséhez speciális nyelvek és szoftverek állnak rendelkezésre: FRL (Frame Representation Language), KRL (Knowledge Representation Language), frame Kappa shell, PILOT/2 és mások.

A keretelmélet legfontosabb tulajdonsága a szemantikai hálózatok elméletéből kölcsönzött tulajdonságok öröklődése. Mind a keretekben, mind a szemantikai hálózatokban az öröklődés az ISA-n keresztül történik. Egy ISA-rés a hierarchia magasabb szintjén lévő keretre mutat, ahonnan a hasonló slotok értékei implicit módon öröklődnek, azaz átkerülnek.

A keretek, mint a tudás reprezentációs modelljének fő előnye, hogy megfelelnek az emberi hosszú távú emlékezet szerveződéséről szóló modern elképzeléseknek, valamint rugalmasságuk és egyértelműségük. A tudásreprezentáció keretmodelljeinek előnyei akkor jelennek meg, ha az általános kapcsolatok ritkán változnak, és a témakörben kevés kivétel van.

A keretmodellek hátrányai közé tartozik viszonylag nagy bonyolultságuk, ami a következtetési mechanizmus sebességének csökkenésében és a kialakított hierarchiában történő változtatások munkaintenzitásának növekedésében nyilvánul meg. Ezért a keretrendszerek fejlesztése során nagy figyelmet fordítanak a vizuális megjelenítési módszerekre és a keretszerkezetek szerkesztésének hatékony eszközeire.

Megjegyezhető, hogy az objektum-orientált megközelítés a keretnézet továbbfejlesztése. Ebben az esetben a keretsablont osztálynak, a keretpéldányt objektumnak tekinthetjük. Az objektumorientált programozási nyelvek eszközöket biztosítanak osztályok és objektumok létrehozásához, valamint eszközöket az objektumok feldolgozására szolgáló eljárások leírásához (módszerek). A keretmodellek azonban nem teszik lehetővé rugalmas következtetési mechanizmus szervezését, így a keretrendszerek vagy objektum-orientált adatbázisok, vagy más tudásfeldolgozó eszközökkel, például logikai modellekkel való integrációt igényelnek.

A tudásmérnökségben ontológiai modell alatt egy bizonyos témakör vagy problémakör részletes leírását értjük, amelyet általános jellegű állítások megfogalmazására használnak. Az ontológiák lehetővé teszik a fogalmak gépi feldolgozásra alkalmas formában történő ábrázolását.

A legtöbb ontológia középpontjában a tartományi fogalmakat leíró osztályok állnak. Az attribútumok az osztályok és példányok tulajdonságait írják le. Itt vannak analógiák a tudás formalizálásának keretes megközelítésével. Számos koncepció és megvalósítási elv, valamint a grafikus ábrázolás a strukturálás kezdeti szakaszában az ontológiákban hasonló a szemantikai hálózatokhoz. A fő különbség az ontológiák közvetlen számítógép általi használatra való orientációjában rejlik, vagyis az adatstruktúrákat nem természetes nyelven írják le (amint az a szemantikai hálózatokban és a tezauruszokban megszokott), hanem egy speciális formális nyelven. Az ontológiáknak is sok közös vonásuk van a tezauruszokkal. De ellentétben velük, az ontológiai modellekkel szemben támasztott követelmény a belső teljesség, a logikai összekapcsolódás és a használt fogalmak következetessége. Előfordulhat, hogy a tezauruszok nem felelnek meg ezeknek a követelményeknek. Az ontológiák leírására olyan formális nyelveket használnak, mint az RDF, OWL, KIF, CycL, OCML és mások.

Általában az ontológiák következő fő elemeit különböztetjük meg:

– másolatok;

– objektumok osztályai (fogalmak);

– attribútumok (osztályok és példányok tulajdonságainak leírása);

– függvények (az osztályok és példányok közötti függőségek leírása);

– axiómák (további megszorítások).

A specializált (tartomány-orientált) ontológiák bármely tudásterületet vagy a valós világ egy részét reprezentálják. Egy ilyen ontológia a kifejezések sajátos jelentését tartalmazza erre a területre. Például a mező szó a mezőgazdaságban földdarabot jelent, a fizikában az anyag egyik fajtáját, a matematikában algebrai rendszerek osztályát.

Az általános ontológiákat számos területen közös fogalmak ábrázolására használják. Az ilyen ontológiák tartalmaznak egy alapvető kifejezéskészletet, egy szószedetet vagy tezauruszt, amelyeket a tartományi kifejezések leírására használnak.

A modern ontológiai modellek modulárisak, azaz sok, egymással összefüggő ontológiából állnak, amelyek mindegyike külön témakört vagy feladatot ír le. Az ontológiai modellek nem statikusak, folyamatosan változnak.

Ha egy speciális ontológiákat használó rendszer fejlődik, akkor szükség lehet az ontológiák egyesítésére. Az ontológiai modellek fő hátránya a kombinálás nehézsége. Még szorosan kapcsolódó területek ontológiái is összeférhetetlenek lehetnek egymással. A különbség a helyi kultúra, ideológia vagy más leíró nyelvhasználat miatt adódhat. Az ontológiák összevonása manuálisan és félautomatikusan is megtörténik. Összességében ez egy munkaigényes, lassú és költséges folyamat.

Az ontológiai modelleket széles körben alkalmazzák a tudásalapú rendszerekben: szakértői rendszerekben és döntéstámogató rendszerekben. A.F. munkája egy érdekes módot ír le az időről szóló ismeretek ábrázolására, figyelembe véve az ontológiák bizonytalanságát. Tuzovszkij.

Jelenleg a szemantikus webes technológiák meglehetősen ígéretesek, és széles körben használják a gyakorlatban a tudásreprezentációs technológiákat. A Szemantikus Web központi fogalma az ontológia – egy témakör modellje, amely fogalmak halmazából, fogalompéldányok halmazából és kapcsolatok (tulajdonságok) halmazából áll. A fogalmak és a köztük lévő kapcsolatok halmaza egy általános adattárolási sémát határoz meg, amely fogalmak példányaira vonatkozó állítások vagy ontológiai axiómák halmazaként jelenik meg. Az ilyen egyszerű utasítások, amelyeket tripleteknek neveznek, „alany-állítás-objektum” formájúak. A felhasználó által meghatározott szabályrendszer betöltődik a következtetési rendszerbe, amely az ontológiában foglalt állítások alapján e szabályok szerint létrehozza az ontológia fogalmainak és kapcsolatainak új példányait.

Az egyik legjelentősebb probléma mind a tudás időbeli kontextusban való megjelenítése, mind általában a tudás reprezentációja szempontjából az időről és a tudás időbeli változásairól szóló tudás reprezentációja. A legtöbb gyakorlatban használt tudásleíró nyelv azonban elsőrendű predikátumlogikán alapul, és unáris vagy bináris relációkat használ. Ilyen nyelvek például az OWL és az RDF. Ebben az esetben a bináris relációk idő figyelembe vételével történő leírásához egy további, időnek megfelelő paramétert kell bevinni a relációkba. Ebben az esetben a bináris relációk hármas relációkká alakulnak, és túlmutatnak a nyelv leíró képességein.

További fontos feladat az idővel kapcsolatos ismeretek leírása, figyelembe véve ezen ismeretek esetleges hiányosságát. Például olyan kijelentések leírása, mint: „A esemény valamikor a jövőben fog megtörténni”. Ezt a problémát általában a modális temporális logikák, például az LTL keretein belül oldják meg, bizonyos modális operátorok használatával. De mivel az OWL tudásleíró nyelv leíró logikán alapul, lehetetlenné válik az ilyen megoldás alkalmazása az OWL ontológiákhoz.

Művében A.F. Tuzovsky azt javasolja, hogy mutasson be egy modellt az időről szóló ismeretek leírására a következő formában:

< TU, VU, TP, F, Rul >, Ahol

1) TU – TU = (T È (tØ)) időpillanatok halmaza, ahol T egy lineárisan rendezett halmaz, kontinuum hatványával, amelyen a T ´ T ® R+ bináris kivonási művelet adott, és tØ a „határozatlan pillanatnyi időnek” megfelelő speciális elem;

2) VU – a TU halmaz elemeit jelölő változók halmaza, valamint az aktuális időpillanatnak megfelelő speciális tN változó; a tN változó értéke folyamatosan változik, tükrözve az idő múlását valamilyen rendszerben, hogy leírja azt az időkörnyezetet, amelyben a javasolt megközelítést alkalmazzák;

3) TP – időintervallumok halmaza; az időintervallum a t = rendezett párnak felel meg< ti1, ti2 >, ahol ti1 és ti2 a VU halmaz olyan elemei, hogy ((ti1 £ ti2) Ù (ti1 ¹ tØ) Ù (ti2 ¹ tØ)) Ú (ti1 = tØ) Ú
(ti2 = tØ); Így egy időtartam az időskálán egy bizonyos területnek felel meg, és határa lehet egy bizonyos időpillanat, az aktuális időpillanat (tN változó) vagy egy határozatlan időpillanat tØ, míg egy időtartam egybeeső határok (ti1 = ti2) egy adott időpontnak felelnek meg ;

4) F – az időintervallumok tulajdonságait, valamint a köztük lévő minőségi kapcsolatokat leíró predikátumok halmaza;

5) Rul – a (G ® H) és (G « H) alakú szabályok összessége, amely leírja a logikai következtetés alapvető mechanizmusait, beleértve az F predikátumok értékére vonatkozó korlátozásokat, valamint a határok bizonyosságát időintervallumok.

Az időintervallum fogalma bizonyos időintervallumok leírásához szükséges, amelyek pontos határai a modell egy bizonyos állapotának bekövetkezéséig ismeretlenek. Azt mondhatjuk, hogy minden időperiódus egy bizonyos időintervallumot ír le, amelynek pontos határai még ismeretlenek. Ebben az esetben információ állhat rendelkezésre arról, hogy ez az intervallum mely határokon belül garantáltan elhelyezkedik az időskálán, és a jövőben ismertté válhatnak az időszak által leírt intervallum pontos határai. Ezért kétféle időintervallum határt vezetnek be: pontos és garantált. Kétféle határvonal meghatározásához az EL (exactleft), ER (exactright), GL (garantált bal) és GR (garantált jobb) predikátumokat használjuk, amelyek rendre meghatározzák az időszak pontos bal/jobb és garantált bal/jobb határait. Például az EL predikátum (ti, ti1) megfelel a „ti intervallum pontos bal határa a ti1 időpillanat” állításnak. Az egyszerűség kedvéért egy időintervallum határának típusa különböző zárójelekkel jelölhető: egy teljesen meghatározott intervallum (mindkét határa pontos); intervallum .

Az ügynök a cselekvés animált kezdeményezője és irányítója.

Címzett – az üzenet címzettje (a címzettel kombinálható).

Kedvezményezett (Recipient, Possessor) az a résztvevő, akinek az érdekei a helyzet során közvetetten érintettek (előnyben vagy kárban részesül).

Az eszköz egy érzelmi inger vagy egy résztvevő, amelynek segítségével egy cselekvést végrehajtanak.

A forrás az a hely, ahonnan a mozgás megtörténik.

A szerződő fél olyan erő vagy ellenálló környezet, amely ellen cselekményt hajtanak végre.

Az objektum egy résztvevő, amely egy esemény során mozog vagy változik.

A páciens olyan résztvevő, amely jelentős változásokon megy keresztül.

Az eredmény egy olyan résztvevő, aki egy esemény eredményeként jelenik meg.

Az inger egy külső ok vagy tárgy, amely ezt az állapotot okozza.

A cél az a hely, ahová a mozgást végrehajtják.

A tapasztaló az a résztvevő, aki olyan belső állapotot él meg, amely nem vezet külső változásokhoz (érzések és észlelések hordozója).

Az Effektor egy élettelen résztvevő, gyakran természetes erő, amely változást okoz a páciens állapotában.

Az argumentumok számának és szemantikai tulajdonságainak megfelelően a verbális lexémák halmaza osztályokra osztható. Vegyük például az igék következő szereptípusait: fizikai hatású igék (vág, fűrész, vág); az észlelés igéi (látni, hallani, érezni); beszédigék (kiabál, suttog, motyog). Minden osztályon belül van egy pontosabb felosztás. A fizikai hatás igék közül az ige alakú igék (Agent, Tool, Object) hasonló szemantikai állítmány-argumentum szerkezettel rendelkeznek: tör - tör, hajlik - hajlik, hajt - hajlik, széttör - darabokra tör, reped - hasít, stb.. Egy másik, az ige alakú igékre jellemző állítmány-argumentum szerkezet (Agent, Tool, Goal): üt - üt, pofon - pofon, üt - üt, üt - üt (valamiről), stroke - stroke, stb.

Megállapítható, hogy egyrészt a morfológiai esetek, az elöljárószavak, a szintaktikai szerepek, másrészt a szemantikai szerepek között vannak összefüggések, például késsel vágni, Jánossal dolgozni, festékkel permetezni. Emellett figyelembe kell venni, hogy egy állítmány szónak nem lehet két azonos szemantikai szerepű aktusa. A szerepcsoportok közötti különbségek főként a perifériás szemantikai szerepeket érintik (Vállalkozó, Ösztönző, Forrás), vagy az alapszerepek egyesítése/feldarabolása (ügynök vs. ügynök és végrehajtó; címzett vs címzett, címzett és kedvezményezett; páciens/téma/tárgy) vs. beteg, téma és eredmény).

C. Fillmore művében még egy szabályt is javasolt a szemantikai szerepek szintaktikai szerepek közvetett leképezésére: ha van ügynök az argumentumok között, az lesz az alany; Megbízott hiányában, ha van Eszköz, az lesz az alany; Ügynök és Eszköz hiányában az alany lesz a Tárgy. Innentől természetesen a szemantikai szerepek hierarchiája keletkezik. A szemantikai szerepek legismertebb hierarchiája: Ügynök > Eszköz > Beteg; Ügynök > Forrás > Cél > Eszköz > Tárgy > Hely; Ügynök > Kedvezményezett > Tapasztaló > Eszköz > Téma > Hely és még néhány A szemantikai szerepek hierarchiája úgy van felépítve, hogy az érvek tematikus hovatartozásának mértékét (aktualitást) tükrözze, így a pragmatikailag legfontosabb szemantikai szerepek. a hierarchia bal végén helyezkednek el, a jobb oldalon pedig olyan szemantikai szerepek, amelyekre nem jellemző a magas aktualitás.

Kezdetben a szemantikai szerepeket primitívnek tekintették, és nem voltak alávetve további elemzésnek, amely felfedhetné belső szerkezetüket. Ebben az esetben azonban számos probléma merül fel. Először is, az egyre gondosabb szemantikai és szintaktikai elemzés eredményeként a szerepek listája korlátlanul bővül. Másodszor, a strukturálatlan szereplisták nem teszik lehetővé, hogy előrejelzéseket tegyünk az igék lehetséges szereptípusairól, vagy megmagyarázzuk a nem hitelesített típusok hiányát. Ezért a szemantikai szerepelmélet a szerepek megkülönböztető jegyek vagy protoszerepek alapján történő meghatározását javasolta. Például D. Doughty javasolja, hogy emeljék ki az Agent protorol következő tulajdonságait: önkéntesen részt vesznek egy eseményben vagy állapotban; tudatos és/vagy észlelő résztvevő; eseményt vagy állapotváltozást kezdeményez egy másik résztvevő számára; mozog (egy térbeli ponthoz vagy egy másik résztvevőhöz képest); az igével jelölt eseménytől függetlenül létezik.

A szemantikai szerepek és esetek között sajnos jelenleg nem lehet egy az egyhez megfelelést megállapítani, vagyis funkcionális szempontból az esetkategória heterogén. A helyzetet tovább bonyolítja, hogy maguk a szerepek nem triviálisan kapcsolódnak egymáshoz, és a természetes nyelvekben gyakoriak az olyan generatív technikák, mint a metafora és a metonímia, amelyek sok új jelentést adnak, és elvileg nem. tükröződjön egy statikus lexikonban.

A tudásreprezentáció logikai modelljei

A tudásreprezentáció logikai modelljeinek felépítése során alkalmazott megközelítés fő gondolata az, hogy az alkalmazott problémák megoldásához szükséges összes információt tények és kijelentések halmazának tekintik, amelyeket valamilyen logikában képletként jelenítenek meg. A tudást egy sor ilyen képlet tükrözi, az új tudás megszerzése pedig a logikai következtetési eljárások végrehajtására redukálódik. A tudásreprezentáció logikai modelljei a formális elmélet fogalmán alapulnak, amelyet az S = sor definiál< B, F, A, R>, ahol B az alapszimbólumok megszámlálható halmaza (ábécé); F – képleteknek nevezett halmaz; A – a priori igaz képletek (axiómák) kiválasztott részhalmaza; R a formulák közötti relációk véges halmaza, amelyet következtetési szabályoknak nevezünk.

A számítási nyelvészetben a jelentés reprezentációjának fő megközelítése a jelentés formális formában történő megjelenítése. Az ilyen reprezentációt jelentésreprezentáló nyelvnek nevezhetjük. A reprezentációs nyelv szükséges a természetes nyelv és a világról szóló általános ismeretek közötti szakadék áthidalásához. És mivel ezt a nyelvet automatikus szövegfeldolgozásra és mesterséges intelligencia rendszerek létrehozására szánják, figyelembe kell venni a szemantikai feldolgozás számítási követelményeit, például az állítások igazságtartalmának meghatározását, az egyértelműség megőrzését. reprezentációt, az állításokat kanonikus formában ábrázolja, logikus következtetést adjon, és legyen kifejező.

A természetes nyelveknek sokféle technikája van a jelentés közvetítésére. A legfontosabbak közé tartozik az állítmány-argumentum szerkezetének közvetítésének képessége. A fentieket figyelembe véve azt találjuk, hogy az elsőrendű predikátumlogika kiválóan alkalmas az állítások jelentésének ábrázolására. Egyrészt az ember számára viszonylag könnyen érthető, másrészt (számítógépes) feldolgozásra is kiválóan alkalmas. Az elsőrendű logika segítségével fontos szemantikai osztályok írhatók le, beleértve az eseményeket, az időt és más kategóriákat. Nem szabad azonban elfelejteni, hogy az olyan fogalmaknak megfelelő kijelentésekhez, mint a hiedelmek és vágyak, olyan kifejezésekre van szükség, amelyek modális operátorokat tartalmaznak.

Az előző részben tárgyalt szemantikai hálózatok és keretek az elsőrendű predikátumlogika keretein belül tekinthetők. Például a Van egy könyvem mondat jelentése négy különböző módon írható fel, négy különböző nyelven a jelentés ábrázolására (lásd 4. ábra, a számozás az ábra sorrendjének felel meg): 1) fogalmi függőség diagram; 2) keret alapú ábrázolás; 3) szemantikai hálózat; 4) elsőrendű predikátumszámítás.

Bár ez a négy megközelítés különbözik egymástól, elvont szinten egy általánosan elfogadott alapmegjelölést képviselnek, miszerint a jelentésreprezentáció sok szimbólumból álló struktúrákból áll. Ezek a szimbolikus struktúrák a tárgyaknak és az objektumok közötti kapcsolatoknak felelnek meg. Mind a négy reprezentáció a „beszélőnek”, egy „könyvnek” megfelelő szimbólumokból és az egymás birtoklását jelző relációk halmazából áll. Itt az a fontos, hogy mindez a négy gondolat lehetővé teszi egyrészt a természetes nyelv kifejező vonásainak, másrészt a világ valós állapotának összekapcsolását.

A tudásreprezentáció logikai modelljei számos előnnyel rendelkeznek. Először is, itt a matematikai logika klasszikus apparátusát használjuk „alapként”, amelynek módszerei meglehetősen jól tanulmányozottak és formálisan igazoltak. Másodszor, vannak meglehetősen hatékony eljárások a szintaktikailag helyes állítások származtatására. Harmadszor, ez a megközelítés lehetővé teszi, hogy csak egy sor axiómát tároljunk a tudásbázisokban, és minden más tudás (beleértve a tényeket és információkat az emberekről, tárgyakról, eseményekről és folyamatokról) ezekből az axiómákból nyerhető a következtetés szabályai szerint.

A jelentést ábrázoló nyelvnek, mint minden nyelvnek, megvan a maga szintaxisa és szemantikája. Az 5. ábra a szövegkörnyezet nélküli nyelvtan leírását adja az elsőrendű predikátumszámításhoz.

Fontolja meg a könyvben szereplő kategóriák, események, idő, szempontok és hiedelmek jelentésének bemutatását.

Kategória bemutatása. A kategória olyan szavak csoportjaként értendő, amelyeket egy közös jellemző egyesít, hasonlóan ahhoz, ahogyan a tezauruszban szerveződik. Az állítmányszerű szemantikával rendelkező szavak gyakran tartalmaznak kiválasztási kényszereket, amelyeket rendszerint szemantikai kategóriák formájában fejeznek ki, ahol a kategória minden tagjának van egy sor releváns jellemzője.

A kategóriák megjelenítésének legegyszerűbb módja, ha minden kategóriához egy unáris predikátumot hozunk létre. Ekkor azonban nehéz lesz kijelentéseket tenni magukról a kategóriákról. Tekintsük a következő példát. Tegyük fel, hogy az elsőrendű predikátumlogika nyelvezetét használva képviselnie kell az állítás jelentését: „Harry Potter” a legnépszerűbb gyerekkönyv. Vagyis meg kell találni a leggyakrabban előforduló kategóriaobjektumot a MostPopular (HarryPotter, ChildrensBook) formában. Ez a képlet nem valódi elsőrendű logikai formula, mivel a predikátumokban szereplő argumentumoknak definíció szerint kifejezéseknek kell lenniük, nem pedig más predikátumoknak. A probléma megoldására az állításban részt vevő összes fogalom teljes értékű objektumként ábrázolható, vagyis a ChildrensBook kategória HarryPotterrel egyenrangú objektumként ábrázolható. Az ilyen kategóriába való tagságot az ISA reláció jelzi (HarryPotter, ChildrensBook). Az ISA (a) reláció az objektumok és az objektumok közötti kategóriák közötti kapcsolatot jelzi. Ez a technika használható kategóriahierarchiák létrehozására. Például az AKO (ChildrensBook, Book) relációt használjuk. Itt az AKO (egyfajta) reláció az egyik kategória egy másikba való beemelését jelöli. Természetesen a nagyobb megbízhatóság érdekében a kategóriákat tények nagy halmazával kell jellemezni, vagyis a kategóriákat halmazként kell meghatározni.

Eseményábrázolás. Egy esemény jelentésének elképzeléséhez elegendő azt predikátum formájában figyelembe venni olyan érvek halmazából, amelyek bizonyos szerepet töltenek be, és szükségesek a helyzet leírásához. Az ilyen predikátumok példái az első részben találhatók (itt I. A. Melchuk által javasolt lexikális függvényekből származnak). Egy másik példa: Foglalás (Hallgató, ma, 20:00, 2). Itt az argumentumok olyan objektumok, mint a személy, étterem, nap, idő és az étteremben lefoglalható helyek száma. Az igék esetében ilyen reprezentációt kaphatunk, ha feltételezzük, hogy az argumentumok szintaktikai aktánsoknak felelnek meg. Ezzel a megközelítéssel négy probléma van:

– az egyes eseményekhez a szerepek helyes számának meghatározása;

– tények megjelenítése az eseménnyel kapcsolatos szerepekről;

– annak szükségessége, hogy minden helyes következtetés közvetlenül levonható legyen az esemény ilyen ábrázolásából;

– annak szükségessége, hogy az eseményábrázolásból ne lehessen téves következtetést levonni.

Például az "is" igének egy-négy aktánsa lehet a mondat által leírt helyzettől függően. Ezért nem világos előre, hogy mi legyen az állítmány helye. Hiszen az elsőrendű predikátumszámításban az argumentumok számát rögzíteni kell.

Az egyik megoldás az, ha feltételezzük, hogy az ilyen helyzeteket szintaktikai szinten dolgozzák fel. Minden egyes argumentumkonfigurációhoz külön alkategóriákat is figyelembe lehet venni. Ennek a módszernek a szemantikai analógja a lehető legtöbb predikátum létrehozása, amelyek mindegyike megfelel az egyedi helyzeteknek. A predikátum neve ugyanaz, de az argumentumok száma eltérő:
Eating1 (w) – ettem; Eating2 (w, x) – ettem egy szendvicset; Eating3 (w, x, y) – Ebédre eszek egy szendvicset; Eating4 (w, x, y, z) – Otthon ettem egy szendvicset ebédre. Ezért különbözőnek tekintik őket. Ez a megközelítés megkerüli az érvek számának problémáját, de nem hatékony. A predikátumok javasolt nevein kívül semmi sem egyesíti őket egyetlen eseménnyé, bár logikai kapcsolatuk nyilvánvaló. Kiderül, hogy a javasolt predikátumok alapján néhány logikai összefüggés nem érhető el. Sőt, ezeket a logikai összefüggéseket a tudásbázisban kell keresnie.

Ezt a problémát szemantikai posztulátumok használatával lehet megoldani. Kifejezetten összekapcsolják az állítmányok szemantikáját. Például: " w, x, y, z Eating4 (w, x, y, z) Þ Eating3 (w, x, y).

A predikátumok morfológiai, szintaktikai és szemantikai információkat tükrözhetnek. Ilyen szemantikai posztulátumok például az első részből származó lexikai predikátumokat tartalmazó formulák. Az orosz nyelvű szavak és mondatok felépítésének morfológiai és szintaktikai jellemzőit tartalmazó szemantikai posztulátumok szerepelnek. A szemantikai terhelést hordozó szemantikai posztulátumokra az előző részben találtunk példákat.

Megjegyezzük, hogy nem szabad összekeverni a természetes nyelvű állítás szemantikáját és az állítmány szemantikáját, amelyet azért vezetünk be, hogy tükrözzük az állítás szemantikáját. A szemantikai posztulátumok a predikátumok szemantikáját tükrözik, vagyis az általunk bevezetett predikátumok közötti szemantikai kapcsolatokat.

Nyilvánvaló, hogy ez a megközelítés a predikátumok közötti szemantikai kapcsolatok felfedezésére alkalmas kis tartományokra, és skálázhatósági problémákkal jár. Kényelmesebb lenne azt mondani, hogy ezek a predikátumok egyetlen predikátumra vonatkoznak, és bizonyos pozíciókban hiányoznak az argumentumok. Ebben az esetben megteheti a szemantikai posztulátumok nélkül. De ennek a módszernek van egy hátránya is. Például, ha figyelembe vesszük az Eating (w, x, y, z) predikátumot, és feltételezzük, hogy a halmaz egyik szavának (reggeli, ebéd, vacsora) jelen kell lennie harmadik argumentumként, akkor a létezés kvantor egy másikhoz van rendelve. változó az egyes étkezésekhez kapcsolódó létezésspecifikus élelmiszereket jelenti, ami nem igaz.

Nézzünk egy megfelelő példát. Írjunk le három állítást (ebédeltem, otthon ettem és otthon ettem szendvicset ebédre) elsőrendű logikával:

$w, x étkezés (hangszóró, w, ebéd, x)

$w, x étkezés (hangszóró, w, x, otthon)

$ w Evés (hangszóró, w, ebéd, otthon).

Tegyük fel, hogy egy eseményre vonatkozó első két képletből egy harmadik képletet kell előállítani. A független események, amelyeket ebédeltem és otthon ettem, nem engedik meg azt a következtetést levonni, hogy otthon ebédeltem. A kategóriaábrázoláshoz hasonlóan ezt a problémát is megoldhatjuk úgy, hogy az eseményeket objektumként kezeljük, így azok számszerűsíthetők és más objektumokhoz kapcsolhatók meghatározott relációkészletek segítségével. Most ennek a megközelítésnek megfelelően a következő ábrázolást kapjuk.

Az ajánlatért megettem az ebédet

$ w ISA (w, Eating) Ù Eater (w, Speaker) Ù Eater (w, Eating).

Az otthon ettem mondatért

$ w ISA (w, evés) Ù Eater (w, hangszóró) Ù Hely (w, otthon).

A szendvicset ettem otthon ebédre mondatért

$ w ISA (w, evés) Ù evő (h, hangszóró) Ù megevett (h, szendvics) Ù MealEaten (h, ebéd) Ù hely (h, otthon)

A bemutatott megközelítés lehetővé teszi, hogy megszabaduljunk attól, hogy a predikátumban meghatározott számú argumentumot adjunk meg, függetlenül a szerepektől és más aktusoktól. Nincsenek más szerepek, amelyeket a mondat ne említene, és a szemantikailag rokon predikátumok közötti logikai kapcsolatokhoz nincs szükség szemantikai posztulátumok használatára.

Az idő ábrázolása. Az időbeli logikát arra használják, hogy leírják az események sorozatait és azok kapcsolatait egy idővonalon. A természetes nyelvekben ilyen eszköz az igeidő. Egy esemény megelőzi a másikat, ha az idő folyama az első eseménytől a másodikig vezet. Itt születnek a múltról, jelenről és jövőről alkotott ismerős fogalmaink.

Az időbeli logika kétféle operátort használ: logikai és modális. A propozíciószámítási logika szokásos operátorait logikai operátorként használják: konjunkció, diszjunkció, negáció és implikáció. A modális operátorok meghatározása a következő.

N j – Következő: j-nek igaznak kell lennie az adott állapotot közvetlenül követő állapotban.

F j – Jövő: j-nek a jövőben legalább egy állapotában igazzá kell válnia.

G j – Globálisan: j-nek minden jövőbeli állapotban igaznak kell lennie.

A j – Összes: a j-t minden ezzel kezdődő ágon végre kell hajtani.

E j – Létezik: Legalább egy ág van, amelyen a j végrehajtódik.

j U y – Amíg (erős): y-t valamilyen jövőbeni állapotban kell végrehajtani (esetleg a jelenlegiben), a j tulajdonságot a jelzett állapotig minden állapotban végre kell hajtani (nem beleértve).

j R y – Elengedés: j felszabadítja y-t, ha y igaz, egészen addig, amíg j igazzá nem válik (vagy mindig, ha ilyen pillanat nem következik be). Ellenkező esetben j-nek legalább egyszer igazzá kell válnia, mielőtt y első alkalommal igazzá válik.

Szempontok ábrázolása. Az igék a cselekvések leírására szolgálnak természetes nyelveken. Z. Vendler amerikai filozófus 1957-ben modellt javasolt az igék lexikális szempontok szerinti felosztására. Négy osztályt azonosított:

– statívumok (állapotok) – statikus állapotokat leíró igék, amelyeknek nincs végpontja (például „tudom”, „szeretni”);

– tevékenységek (tevékenységek) – dinamikus állapotokat leíró igék, amelyeknek nincs végpontja (például „fut”, „hajt”);

– accomplishments (accomplishments) – olyan eseményeket leíró igék, amelyeknek van végpontja és fokozatosak (pl. „festeni egy képet”, „házat építeni”);

– eredmények (teljesítmények) – olyan eseményeket leíró igék, amelyeknek van végpontja és azonnal bekövetkeznek (például „felismer”, „észrevesz”).

A 2. táblázat az angol igék Wendler-osztályainak összehasonlító táblázatát mutatja be.

Mint látható, a cselekvés folytatása a tevékenységekre és az eredményekre jellemző, és hiányzik a cselekvésekből és az eredményekből. Mondhatod, hogy forrt (tevékenység), és levelet írtam (elkötelezettség), de nem mondhatod, hogy létezett (nyilatkozat), és könyvet találtam (teljesítmény). Az eredmények nem kapcsolódnak az időtartam körülményeihez. Azt lehet mondani, hogy két órán át létezett (állítás), de azt nem, hogy két óráig megtaláltam (teljesítmény).

A teljesítmények és eredmények a céltudatos cselekvéseket írják le, ellentétben a nyilatkozatokkal és tevékenységekkel. Mondhatni, hogy két óra alatt írtam egy levelet (elkötelezettség), de azt nem, hogy két óra alatt gyalogoltam (aktivitás).

Hiedelmek, vágyak és szándékok képviselete. A beszélőnek a közölt információhoz való hozzáállásának kifejezésére természetes nyelvű kijelentésekben olyan szavakat használnak, mint hinni, akarni, hinni, elképzelni stb. Az ilyen kijelentések nem objektív világképet írnak le, hanem a beszélő személyes felfogásának jellemzőit, a világról alkotott „belső” elképzeléseit. Vegyük fontolóra azt a kijelentést, amely szerint John azt olvassa, hogy „Harry Potter”. Helytelen, ha állítmányi logikával próbáljuk megjeleníteni a jelentését: Believing (Speaker, Reading (John, HarryPotter). Itt a második argumentumnak egy kifejezésnek kell lennie, nem egy képletnek. Ez a szintaktikai hiba szemantikai hibát von maga után. Az elsőrendű logikában , a predikátumok objektumokat kapcsolnak össze, nem pedig a köztük lévő kapcsolatokat. A probléma megoldásának szokásos módja olyan operátorok hozzáadása, amelyek lehetővé teszik a számunkra szükséges állításokat :

Hisz (hangszóró, $ x ISA (x, olvasás) Ù Olvasó (x, János) Ù Olvas (x, HarryPotter)).

Nem mondható el, hogy egy ilyen reprezentációt elsőrendű állítmányszámítással írták volna le, de ez megerősíti, hogy a nyelvben létezik egy olyan igecsoport, amely a szemantikai elemzésben kiemelt szerepet játszik. Az automatizált elemző rendszerekben néha szükség van a felhasználói meggyőződések és szándékok nyomon követésére. A helyzetet bonyolítja, hogy a párbeszéd során a hiedelmek, vágyak, szándékok változhatnak.

A megadott operátort modálisnak nevezzük. Különféle modális operátorok léteznek. Az időbeli modalitásról valamivel korábban már szó esett, amikor az idő megnyilatkozásokban való megjelenítéséről beszéltünk. Az időbeli mellett van egy térbeli modalitás, a tudás logikája („tudható, hogy”), a bizonyíthatóság logikája („ezt bizonyítani lehet”) és egyebek. A modális operátorokkal kiterjesztett logikát modális logikának nevezzük. Jelenleg sok összetett, feltáratlan kérdés maradt ezen a területen. Hogyan működik a következtetés meghatározott modális operátorok jelenlétében? Milyen típusú képletekre alkalmazhatók bizonyos operátorok? Hogyan lépnek kapcsolatba a modális operátorok a kvantorokkal és logikai összeköttetésekkel? Ezeket és más kérdéseket még meg kell vizsgálni. Itt nem foglalkozunk velük.

A szintaktikailag helyes állítások levezetése a tudásreprezentáció logikai modelljeiben a J. Robinson által 1965-ben kidolgozott felbontási szabályon alapul. Kimondja, hogy ha a premisszát képező kifejezések egy csoportja igaz, akkor egy következtetési szabály alkalmazása garantáltan egy igaz kifejezést eredményez következtetésként. A felbontási szabály alkalmazásának eredményét rezolvensnek nevezzük.

A feloldási módszer (vagy az ellentmondások kiküszöbölésének szabálya) lehetővé teszi, hogy egy feltett feltételezés igazát vagy hamisságát ellentmondással bizonyítsuk. A rezolválási módszerben általában összetett predikátumnak tekintjük az állítások halmazát, amely több, logikai függvényekkel és létezési és univerzalitási kvantorokkal összekapcsolt predikátumot tartalmaz. Mivel az azonos jelentésű predikátumok különböző formájúak lehetnek, a mondatokat először egységes formába kell hozni (disjunktív vagy konjunktív normálforma), amelyben a létezés, az egyetemesség, az implikáció szimbólumai, az ekvivalencia stb a bal oldalon diszjunkciók konjunkcióját tartalmazza. Ezért a bizonyításhoz használt premisszák olyan formába hozása, amely a diszjunkciók kötőszavait reprezentálja, szinte minden olyan algoritmusban szükséges lépés, amely a felbontási módszeren alapuló logikai következtetést valósítja meg.
A következő lépéseket követi a következtetési folyamat a felbontási szabály használatával.

1. Az ekvivalencia és az implikáció műveletei megszűnnek:

A «B = (A® B) Ù (B® A);

A ® B = Ø A Ú B.

2. A negációs művelet a képleteken belül mozog De Morgan törvényei alapján:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. A logikai képletek diszjunktív formára redukálódnak:

A Ú (B Ù C) = (A Ú B) Ù (A Ú C).

A predikátumlogikában a felbontási szabály alkalmazásához a logikai képletek bonyolultabb transzformációját kell végrehajtani, hogy azokat diszjunktrendszerré redukáljuk. Ennek oka a további szintaktikai elemek, elsősorban kvantorok, változók, predikátumok és függvények.
A predikátum logikai képletek egyesítésére szolgáló algoritmus a következő lépésekből áll.

1. Az egyenértékűségi műveletek kiiktatása.

2. Implikációs műveletek kiküszöbölése.

3. Negációs műveletek bevezetése képleteken belül.

4. A létezéskvantifikátorok megszüntetése. Ez megtörténhet a harmadik lépésben a De Morgan-törvények alkalmazása miatt, nevezetesen a $ tagadása "-re változik, de előfordulhat fordított helyettesítés is. Ezután a $ kiküszöböléséhez a következőképpen járjon el: valamilyen változó minden előfordulása társítva egy egzisztenciális kvantorral, például ($ x), a képletben egy új konstansra cseréljük, például a Ez a konstans az x változó valamilyen (ismeretlen) értékét képviseli, amelyre a képlettel írt állítás igaz fontos, hogy minden olyan helyen, ahol x jelen van, ugyanaz az a értéke lesz behelyettesítve, még akkor is, ha ez pillanatnyilag ismeretlen.

5. Az általános kvantorok a képletekben az első helyre kerülnek. Ez sem mindig egyszerű művelet, néha változók átnevezésével jár.

6. A diszjunkciókon belül elkapott kötőszavak közzététele.

A leírt egységesítési algoritmus összes lépésének elvégzése után alkalmazhatja a felbontási szabályt.

A felbontási szabály volt az alapja a Prolog programozási nyelv létrehozásának.
A Prologban a tényeket meghatározott értékekkel rendelkező logikai predikátumok formájában írják le. A következtetési szabályokat logikai predikátumok írják le, a következtetési szabályok meghatározása a tudásbázisok és információfeldolgozási eljárások feletti predikátumok listája formájában. Maga a Prolog interpreter a fent leírthoz hasonló kimenetet valósít meg. A számítások elindításához egy speciális lekérdezést hajtanak végre a tudásbázis felé, amelyre a logikai programozó rendszer „igaz” és „hamis” válaszokat generál.

A felbontási módszer könnyen programozható, ez az egyik legfontosabb előnye, de csak korlátozott számú esetre alkalmazható, mivel alkalmazásához a bizonyításnak nem kell nagy mélysége, és a lehetséges felbontások száma sem nagy.

Az elsőrendű predikátumszámítási eszköz rugalmasabbá tétele érdekében lambda kalkulussal bővíthető. A lambda-számítás magasabb rendű nyelv, mint az elsőrendű predikátumszámítás. Ebben a lambda függvény nem csak változókkal, hanem argumentumként predikátumokkal is működhet. A lambda-kifejezések használata azonban formálisan nem növeli az elsőrendű logika kifejezőerejét, hiszen minden lambda-kifejezést tartalmazó konstrukció enélkül is ekvivalens formává alakítható.

Miután a Prolog nyelv nagy népszerűségre tett szert, a múlt század 80-as éveinek elején megjelent az „ötödik generációs számítógépek” kifejezés. Akkoriban várható volt az elosztott számítástechnikára összpontosító számítógépek következő generációjának megalkotása. Ugyanakkor azt hitték, hogy az ötödik generáció lesz az alapja az emberi gondolkodás folyamatát utánozni képes eszközök létrehozásának. Ezzel párhuzamosan felmerült a Grace és Delta párhuzamos relációs adatbázisok hardveres támogatásának és a párhuzamos logikai következtetésnek (Parallel Inference Engine, PIE) létrehozásának ötlete is, a Prolog nyelv elvei alapján. Mindegyik következtetési blokk jelezte az aktuális munkaterhelését, hogy a munka a legkisebb terhelésű következtetési blokkra kerülhessen át. De mint tudjuk, az ilyen próbálkozások nem tették lehetővé a mesterséges intelligencia létrehozását, hanem csak újabb megerősítésként szolgáltak arra, hogy az emberi gondolkodást még nem tanulmányozták kellőképpen.

A tudásreprezentáció logikai modelljei lehetővé teszik egy állítás szintaktikai helyességének ellenőrzését. A nyelv szintaxisát meghatározó szabályok segítségével azonban lehetetlen megállapítani egy adott állítás igazát vagy hamisságát. Egy állítás szintaktikailag helyesen megszerkeszthető, de teljesen értelmetlennek bizonyul. Ezen túlmenően a logikai modellek nehezen használhatók egy adott tárgyi probléma sajátosságait tükröző érvelés bizonyításakor, a nagyfokú egységesség miatt.

Szemantikai elemző komponensekkel rendelkező rendszerek

Az Open Cognition projekt részeként készül a Link Grammar Parser elemző, amely a természetes nyelvi feldolgozásért felel. A Link Grammar Parser-t az 1990-es években kezdték fejleszteni. a Carnegie Mellon Egyetemen. Ez a megközelítés eltér a szintaxis klasszikus elméletétől. A rendszer egy mondathoz szintaktikai szerkezetet rendel, amely szópárokat összekötő címkézett kapcsolatok (összekötők) halmazából áll. A Link Grammar Parser információkat használ a szavak közötti kapcsolatok típusairól.

Az elemzőnek körülbelül 60 000 szótárformát tartalmazó szótárai vannak. Lehetővé teszi számos szintaktikai struktúra elemzését, beleértve számos ritka kifejezést és idiómát. A Link Grammar Parser meglehetősen robusztus, képes kihagyni egy mondat egy részét, amelyet nem ért, és meghatározhat valamilyen szerkezetet a mondat többi részére. Az elemző képes ismeretlen szókinccsel dolgozni, és ésszerű találgatásokat tenni (kontextus és helyesírás alapján) az ismeretlen szavak szintaktikai kategóriájára vonatkozóan. Adatai vannak tulajdonnevekről, numerikus kifejezésekről és különféle írásjelekről.

Az elemzés a rendszerben két szakaszban zajlik.

1. Egy mondat több szintaktikai reprezentációjának megalkotása. Ebben a szakaszban figyelembe veszik a szavak közötti kapcsolatok összes lehetőségét, és kiválasztják azokat, amelyek megfelelnek a projektivitás kritériumának (a kapcsolatok nem metszhetik egymást), valamint kiválasztják a minimális kapcsolódási feltételt (a kapott grafikonnak a legkisebb számú összekapcsolt komponenst kell tartalmaznia; a gráf a gráfcsúcsok egy bizonyos halmaza úgy, hogy ebből a halmazból bármely két csúcsnak van út az egyikből a másikba, és nincs út ennek a halmaznak egy csúcsától egy olyan csúcshoz, amely nem ebből a halmazból származik).

2. Utófeldolgozás. Úgy tervezték, hogy a már felépített alternatív mondatszerkezetekkel dolgozzon.

Az így kapott diagramok lényegében az alárendeltségi fák analógjai. Az alárendeltségi fákban a mondatban szereplő fő szótól a másodlagosig lehet kérdést feltenni. Így a szavak fastruktúrába rendeződnek. Egy elemző két vagy több elemzési sémát állíthat elő ugyanahhoz a mondathoz. Ezt a jelenséget szintaktikai szinonimának nevezzük.

A fő ok, amiért az elemzőt szemantikai rendszernek nevezik, a kapcsolatok egyedülállóan teljes halmaza (kb. 100 fő, amelyek közül néhánynak 3-4 opciója van).
Egyes esetekben a különböző kontextusokon végzett gondos munka arra késztette a rendszer szerzőit, hogy a szinte szemantikai besorolásokra térjenek át, amelyek kizárólag szintaktikai elvekre épültek. Így az angol határozószók következő osztályait különböztetjük meg: szituációs határozószavak, amelyek a teljes mondat egészére vonatkoznak (klauzális határozószó); az idő határozói (időhatározók); bevezető határozószavak, amelyek a mondat elején helyezkednek el és vesszővel elválasztva (nyitók); mellékneveket módosító határozószavak stb.

A rendszer előnyei között meg kell jegyezni, hogy a szintaktikai ábrázolás variánsainak keresési eljárásának megszervezése nagyon hatékony. A konstrukció nem felülről lefelé (felülről lefelé) és nem alulról felfelé (alulról felfelé) halad, hanem az összefüggések összes hipotézisét párhuzamosan veszik figyelembe: először szótári képletekkel építik fel az összes lehetséges összefüggést, majd a lehetséges összefüggéseket. e kapcsolatok részhalmazait azonosítjuk. Ez egyrészt a rendszer algoritmikus átláthatatlanságához vezet, mivel nagyon nehéz az összes összefüggést egyszerre nyomon követni, másrészt nem vezet lineáris függéshez az algoritmus sebessége a szavak számától, hanem exponenciálisra, mivel a legrosszabb esetben egy mondatban a szintaktikai szerkezetek összes változatának halmaza ekvivalens egy teljes gráf csúcsokkal rendelkező alapfáinak halmazával.

Az algoritmus utolsó funkciója arra kényszeríti a fejlesztőket, hogy időzítőt használjanak a túl régóta futó eljárás azonnali leállítására. Mindezeket a hiányosságokat azonban bőven kompenzálja a rendszer nyelvi átlátszósága, amelyben egy szó vegyértékeit ugyanolyan könnyedén írják elő, és az algoritmuson belüli vegyértékgyűjtési sorrend nincs alapvetően meghatározva az összefüggések felépítése párhuzamosan, ami teljesen összhangban van nyelvi intuíciónkkal.

A szótár minden egyes szóhoz rögzíti, hogy milyen összekötőelemek kapcsolhatók össze a mondat többi szavaival. A csatlakozó annak a kapcsolattípusnak a nevéből áll, amelybe a kérdéses elemzési egység beléphet. Egyedül több mint 100 fő, legfontosabb kapcsolat van a csatlakozás irányának jelzésére a csatlakozó jobb oldalán egy „+”, balra pedig egy „–” jel található. Az azonos típusú bal- és jobbkezes csatlakozók egy kapcsolatot alkotnak. Egy szóhoz hozzárendelhető egy összekötő képlet, amelyet bizonyos konnektívumok felhasználásával állítunk össze.

Vegyük észre a Link Grammar Parser hátrányait is.

1. A rendszer gyakorlati tesztelése azt mutatja, hogy a 25-30 szót meghaladó összetett mondatok elemzésekor kombinatorikus robbanás lehetséges. Ebben az esetben az elemző munkájának eredménye egy „pánik” gráf, általában egy nyelvi szempontból nem megfelelő szintaktikai struktúra véletlenszerű változata.

2. A fent leírt gondolatok alkalmazása nehézkes az olyan inflexiós nyelvek esetében, mint az orosz, a szótárak számottevően növekvő mennyisége miatt, amely az inflexiós nyelvek morfológiai fejlődése miatt merül fel. Az egyes morfológiai alakzatokat külön képlettel kell leírni, ahol a benne szereplő összekötő alsó indexének illesztési eljárást kell biztosítania. Ez a csatlakozók összetettebb készletéhez és számuk növekedéséhez vezet.

Az Open Cognition projekt, amelyen belül a Link Grammar Parser fejlesztése folyik, nyitott és ingyenes, ami nagy előnyt jelent a kutatás számára. Elég részletes leírás és forráskód található a weboldalon. Az Open Cognition ma is folyamatosan fejlődik, ami azért is fontos, mert lehetősége van a fejlesztőkkel való interakcióra. A Link Grammar mellett fejlesztés alatt áll a RelEx analizátor, amely lehetővé teszi a szemantikai függőségi kapcsolatok kivonatát természetes nyelvű állításokban, és ennek eredményeként a mondatok függőségi fák formájában jelennek meg. Számos szabálykészletet használ a gráf újraépítéséhez, figyelembe véve a szavak közötti szintaktikai kapcsolatokat. Minden egyes lépés után egy sor illeszkedési szabály szerint a szerkezeti jellemzők és a szavak közötti kapcsolatok címkéi hozzáadódnak a kapott gráfhoz. Néhány szabály azonban éppen ellenkezőleg, csökkentheti a grafikont. Így transzformálódik a gráf. A szabálysorozat alkalmazásának ez a folyamata hasonlít a kényszernyelvtanokban használt módszerhez. A fő különbség az, hogy a RelEx grafikonos ábrázolással működik, nem pedig egyszerű (kapcsolatokat jelölő) címkekészlettel. Ez a funkció lehetővé teszi, hogy a szövegek elemzésekor absztraktabb átalakításokat alkalmazzon. Más szóval, az alapötlet az, hogy mintafelismerést használjunk a grafikonok átalakításához. Ellentétben más elemzőkkel, amelyek teljes mértékben a mondat szintaktikai szerkezetére támaszkodnak, a RelEx inkább a szemantika megjelenítésére összpontosít, különösen az entitásokra, az összehasonlításokra, a kérdésekre, az anafora felbontására és a szavak lexikális kétértelműségére.

Tárcsázó rendszer

A „tárcsázás” egy automatikus orosz-angol fordítórendszer, amelyet 1999 és 2002 között fejlesztettek ki. az Automatic Text Processing (AOT) projekt keretében. A rendszer kidolgozásában különböző időpontokban 22 szakember vett részt, többségük neves nyelvész volt.
A „tárcsázás” rendszer alapja a francia–orosz automatikus fordítórendszer (FRAP) volt, amelyet az Összoroszországi Kulturális Központban, a Moszkvai Állami Pedagógiai Intézettel közösen fejlesztettek ki. M. Thorez 1976–1986-ban, valamint az orosz nyelvű politikai szövegek elemzésére szolgáló „Polytext” rendszer, amelyet az Információkutatási Központban fejlesztettek ki 1991–1997 között.

A Polytext rendszer a hivatalos orosz nyelvű dokumentumok elemzésére irányult, és a szövegelemzők teljes láncát tartalmazta: grafetikai, morfológiai, szintaktikai és részben szemantikai. A Dialing rendszerben a grafetikai elemzést részben kölcsönözték, de az új programozási szabványokhoz igazították. A morfológiai elemző program újból készült, mivel a munka sebessége alacsony volt, de maga a morfológiai apparátus nem változott.

Grafematikai szinten az állandók grafematikai leírók. Például LE (lexéma) - cirill karakterekből álló sorozatokhoz van hozzárendelve; ILE (idegen lexéma) – latin karaktersorozatokhoz van hozzárendelve; CC (digitális komplexum) – számokból álló sorozatokhoz van hozzárendelve; CBC (digital-letter complex) - számokból és betűkből álló sorozatokhoz rendelve, stb.

Morfológiai szinten grammemákat használnak a jelölésre - olyan nyelvtani jellemzők, amelyek egy szóalakot egy adott morfológiai osztályhoz kapcsolnak. Az azonos kategóriába tartozó különböző grammok kölcsönösen kizárják egymást, és nem fejezhetők ki egy szóval. Például zhr - női nem, tv - hangszeres eset, pl - többes szám, de - élettelen, sv - tökéletes forma, dst - aktív hang, ne - az ige tranzitivitása, pvl - az ige felszólító alakja, nst - jelen idő az ige stb. d.

A töredezettségelemzés célja, hogy egy mondatot elválaszthatatlan töredékekre (szintaktikai egységek), nagyobb kifejezésekre vagy azzal egyenértékű (szintaktikai csoport) ossza fel, és részleges hierarchiát állítson fel ezen egységek halmazán. A töredékek lehetséges típusai: főmondat, mellékmondat komplex részeként, rész-, rész- és egyéb elszigetelt frázis. Minden egyes töredék esetében ismert, hogy mely töredékek vannak közvetlenül beágyazva, és melyikbe.

A FRAP rendszer egy teljes szövegelemzési láncot tartalmazott a szemantikai elemzésig, amely csak részben valósult meg. A FRAP rendszerben egy szemantikai berendezést fejlesztettek ki és teszteltek, amely alapján a „tárcsázási” rendszerben egy speciális szemantikai elemzési módszert hoztak létre - a teljes opciók módszerét. A FRAP nem tartalmazott a szemantikai reprezentáció szerkezeti értékelésére szolgáló mechanizmusokat, vagyis nem csak egy szövegelem egy előfordulására, hanem a teljes szerkezet egészére vonatkozó módszereket. A teljes variánsok módszerének az a gondolata, hogy az elemzés során egyértelműen el kell különíteni a különböző szakaszokban felmerülő elemzési változatokat, és az egyes változatokat felépítő és értékelő deklaratív nyelvi szabályokat (részmodelleket). Ez a korábban csak a preszemantikus elemzőkhöz használt megközelítés, a számítógép teljesítményének fejlődése miatt ma már átültethető a szemantikára, ezáltal nőtt a rendszer procedurális és deklaratív részeinek szétválasztása. A szemantikai elemzés procedurális része ideális esetben a különböző nyelvi opciókon áthaladó hurkokra esik le. Így a számítógépek megnövekedett sebessége miatt lehetővé vált a nyelvi modellek egyszerűsítése.

A tárcsázásban használt szemantikai apparátus fő összetevői a szemantikai relációk (SR) és a szemantikai jellemzők (SC). Példák szemantikai kapcsolatokra: INSTRU – „eszköz”, LOK – „hely, hely”, PRINADL – „tartozás”, REZLT – „eredmény”, stb. Meglehetősen univerzálisak, és hasonlóak az első részben tárgyalt predikátumokkal és szemantikailag a harmadik részben említett szerepek. A szemantikai jellemzők lehetővé teszik képletek felépítését az „és” és a „vagy” logikai kapcsolók segítségével. Minden szóhoz hozzá van rendelve egy szemantikai jellemzőkből álló képlet. A „Tárcsázás” szemantikai szótára körülbelül 40 szemantikai jellemzőt tartalmaz. Példák szemantikai jellemzőkre: ABST - elvont főnév vagy melléknév, DOLG - egy kémiai anyag vagy valami tömeggel vagy térfogattal mérhető neve; GEOGR – földrajzi objektum; MOVE – mozgás igék; INTEL – szellemi tevékenységgel kapcsolatos cselekvések; COMMUNICA – beszédigék; NOSINF – információhordozók; ORG – szervezet; SOBIR – minden, ami azonos típusú objektumok halmazát jelöli; EMOC – érzelmeket kifejező jelzők stb. Egyes jellemzők összetettek, mert másokkal kifejezhetők. Vannak olyan tulajdonságok, amelyek antonimák. Használatuk ugyanabban az összefüggésben tilos. Vannak olyan jellemzők, amelyek mások változatai. A szemantikai jellemzők a nyelvtani jellemzőkkel együtt igazolják a szóegyezést a szövegbeli összefüggések értelmezésekor.

Jelenleg az AOT projekt keretében kifejlesztett összes eszköz (beleértve a Dialing rendszert is) ingyenes cross-platform szoftver. A demó és a részletes dokumentáció elérhető a weboldalon.

Információ-kinyerési és tudásreprezentációs rendszerek

Vannak más rendszerek is, amelyek szemantikai elemzési komponenseket tartalmaznak. A kutatás szempontjából azonban jelentős hátrányuk van: nehéz olyan leírásokat találni, amelyek nem ingyenesek és szabadon terjeszthetők, vagy nem működnek orosz nyelvű szövegekkel. Ezek közé tartozik az OpenCalais (http://www.opencalais.com/opencalais-api/), az RCO (http://www.rco.ru/?page_id=3554), az Abbyy Compreno (https://www.abbyy.com) /ru-ru/isearch/compreno/), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/) stb.

Érdemes megemlíteni a Pullenti (http://semantick.ru/) strukturálatlan szövegekből adatkinyerési rendszert. A Dialog 2016 konferencián a FactRuEval versenyen T1, T2, T2-m pályán első, T1-l-ben pedig második helyezést ért el. A Pullenti rendszer fejlesztőinek honlapján található egy szemantikai elemző demó verziója is, amely lehetővé teszi egy mondat alapján szemantikai hálózat kiépítését.

A DECL eszközkörnyezetet (http://ipiranlogos.com/) a 90-es évek végén fejlesztették ki, és szakértői rendszerek (ES), ES shell-ek, logikai-analitikai rendszerek (LAS), nyelvi processzorok (LP) felépítésére használták, amelyek feldolgozást biztosítanak. és automatikus tudáskinyerés a nem formalizált dokumentumokból természetes nyelven.

Az "ETAP-3" gépi fordítórendszer orosz és angol nyelvű szövegek elemzésére és fordítására szolgál. A rendszer a természetes nyelvű szövegeknek az Univerzális Hálózati Nyelvben való szemantikai reprezentációjukká történő átalakítását használja. Mint korábban említettük, az „Orosz Nyelv Nemzeti Korpusza” szintaktikai korpusz jelölését az ETAP-3 nyelvi processzor végzi, a „Meaning Û Text” elmélet elvei alapján.

Az utóbbi időben egyre több rendszer jelenik meg a tudásbázisok gráfok formájában történő ábrázolására. Mivel az információ mennyisége folyamatosan, hihetetlen sebességgel növekszik, az ilyen rendszereknek automatikusan támogatniuk kell a tudásbázisok felépítését és frissítését. A tudásbázisok automatikus felépítése strukturált adatforrások alapján történhet.

Példák ilyen rendszerekre: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http://wiki.dbpedia org/), Freebase (https://developers.
google.com/freebase/), a Google Tudásgráfja (https://developers.google.com/knowledge-graph/), az OpenCyc (http://www.opencic.org/) Egy másik megközelítés lehetővé teszi az információk kinyerését nyílt források az interneten emberi beavatkozás nélkül: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
software/openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Az ilyen rendszerek kísérleti jellegűek, mindegyiknek megvannak a maga sajátosságai. Például a Knowledge Vault megpróbálja figyelembe venni a bizonytalanságokat, és minden tényhez hozzárendel egy bizalmi együtthatót és az információ eredetét. Így minden állítás fel van osztva azokra, amelyeknek nagy a valószínűsége, hogy igazak, és olyanokra, amelyek kevésbé valószínűek. A tények és tulajdonságaik előrejelzése gépi tanulási módszerekkel történik, amelyek nagyon sok szövegen és meglévő tényen alapulnak. A Tudástár jelenleg 1,6 milliárd tényt tartalmaz. A Carnegie Mellon Egyetem ReadTheWeb projektjének részeként kifejlesztett NELL rendszer több mint 50 millió állítást tartalmaz különböző megbízhatósági fokokkal. Körülbelül 2 millió 800 ezer ténynek nagy a megbízhatósága. A NELL képzési folyamata szintén nem zárult le.

Vegyük le a következő következtetéseket. A számítástechnika fejlődésével és folyamatos növekedésével
kötetnyi szöveges információ, az automatikus szövegfeldolgozás területén végzett kutatások az alkalmazott szempontra helyezték a hangsúlyt. A legtöbb eszköz lehetőségei a morfológiai és szintaktikai elemzésre korlátozódnak, a valószínűségszámítás és a matematikai statisztika módszereivel kombinálva. Így a legegyszerűbb feladatoknak csak egy kiválasztott részét sikerült megoldani. Más problémákat még meg kell oldani.

Amint láttuk, ennek számos oka van. Például van egy vélemény, hogy a szintaxis minden szabályának megvan a maga analógja a szemantikában. Ezt a posztulátumot szabály-szabály hipotézisnek nevezik. Valójában ez a levelezés nem egy az egyhez, és ez a fő nehézség. Valójában minden szintaktikai szabály (elemző fa) társítható egy szemantikai szabállyal (elemző fa), de nem ez lesz az egyetlen. Ellenkező irányban, hasonlóan a szemantikai szabályhoz, egy szintaktikai szabályt hasonlítanak össze, de nem feltétlenül az egyetlent. Ez a kétértelműség az, ami jelenleg megoldhatatlan problémákhoz vezet az automatikus szövegfeldolgozás területén. Ezzel az érveléssel kapcsolatban felvetődik a kérdés, hogy a kívánt összehasonlítást a sok lehetséges lehetőség közül kell kiválasztani.

A fentiekből még egy nagyon fontos következtetés vonható le. Az állítások generálásának és értelmezésének folyamatait nem szabad külön tekinteni, ezek elválaszthatatlanul összekapcsolódnak
saját magad. Gondolatainak kifejezése során az ember arra összpontosít, hogy a beszélgetőpartnere megérti-e őt. Az állítás generálása során az ember mintegy „újraellenőrzi” magát, modellezve, hogy a beszélgetőpartner hogyan fogja érzékelni az információt. Hasonló mechanizmus van jelen egy állítás értelmezésekor. Amikor megértjük a hallottakat vagy olvasottakat, ismét „ellenőrizzük” tudásunkat és elképzeléseinket a világról. Csak ennek köszönhetően sikerül kiválasztanunk a megfelelő jelentést.

A modern kutatók hajlamosak azt gondolni, hogy a kívánt választás a világról szóló további ismeretek alapján meghozható. Egy ilyen tudásbázisnak általános szemantikai információkat kell tartalmaznia a fogalmakról és a köztük lévő kapcsolatokról, hogy hozzáférve automatikusan meg lehessen határozni az állítás megfelelő kontextusát. Segítene figyelembe venni a világról felhalmozott tudást, amely nincs kifejezetten jelen egy adott megnyilatkozásban, de közvetlenül befolyásolja annak jelentését.

Irodalom

Melchuk I.A. „Jelentés-szöveg” nyelvi modellek elméletében szerzett tapasztalat. M.: Az orosz kultúra nyelvei, 1999. 346 p.
Lahuti D.G., Rubashkin V.Sh. Szemantikai (fogalmi) szótár információs technológiákhoz // Tudományos és műszaki információk. 2000. 7. szám 1–9.
Paducheva E.V. Dinamikus modellek a szókincs szemantikájában. M.: A szláv kultúra nyelvei, 2004. 608 p.
Tuzov V.A. Az orosz nyelv számítógépes szemantikája. St. Petersburg: St. Petersburg State University Publishing House, 2003. 391 p.
Az orosz nyelv nemzeti korpusza. URL: http://www.ruscorpora.ru/ (Hozzáférés dátuma: 2016.08.22.).
Apresyan V.Yu. és mások az orosz nyelv szinonimáinak új magyarázó szótára. M. – Bécs: A szláv kultúra nyelvei – Bécsi Szláv Almanach, 2004. 1488 p.
Khoroshilov A.A. A dokumentumok szemantikai közelségének automatikus megállapításának módszerei fogalmi elemzésük alapján // Elektronikus könyvtárak: ígéretes módszerek és technológiák, elektronikus gyűjtemények: tr. XV összoroszországi tudományos konf. RCDL" 2013. Yaroslavl: YarSU Publishing House, 2013. 369–376. o.
Rubashkin V.Sh. Jelentésábrázolás és jelentéselemzés intelligens információs rendszerekben. M.: Nauka, 1989. 189 p.
Lahuti D.G., Rubashkin V.Sh. Eszközök és eljárás természetes nyelvű bemeneti üzenetek fogalmi értelmezéséhez // Izv. A Szovjetunió Tudományos Akadémia. Ser. Műszaki cybern. 1987. No. 2. P. 49–59.
Rubashkin V.Sh. Szemantikai komponens szövegértési rendszerekben // KII-2006. Tr. 10 nemzeti konf. szerint mesterséges hírszerzés nemzetközivel rész. 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (Hozzáférés dátuma: 2016. 08. 23.).
Paducheva E.V. A típus és a kiindulópont szemantikája // Izv. Szovjetunió Tudományos Akadémia: Ser. megvilágított. és a nyelv 1986. T. 45. 5. sz. 18–25.
Paducheva E.V. Predikátumnevek lexikográfiai szempontból // Tudományos és műszaki. inf. 1991. Ser. 2. 5. sz. 21–31.
WordNet. Angol lexikális adatbázis. URL: http://wordnet.princeton.edu/ (Hozzáférés: 2016. 08. 23.).
Szemantikus web. URL: https://ru.wikipedia.org/wiki/Semantic_net (Hozzáférés dátuma: 2016.08.23.).
Minsky M. Minsky "s frame system theory // Proceedings of the Workshop on Theoretical issues in natural language processing (TINLAP "75). 1975, pp. 104–116.
Khabarov S.P. A tudás megjelenítése információs rendszerekben: jegyzet. URL: http://www.habarov.spb.ru/bz/bz07.htm (Hozzáférés dátuma: 2016. 08. 23.).
Lutsenko E.V. A tudás reprezentációja az információs rendszerekben: elektronika. tankönyv kézikönyv diákoknak. Krasznodar: KubGAU Kiadó, 2010. 428 p.
Konstantinova I.S., Mitrofanova O.A. Ontológiák mint tudástároló rendszerek // Vseros. kompetitív kiválasztási stat. prioritás szerint irány "Információs és távközlési rendszerek." 2008. 54 p.
Razin V.V., Tuzovsky A.F. Az időre vonatkozó ismeretek ábrázolása a bizonytalanság figyelembevételével szemantikus WEB ontológiákban // Dokl. Tomszk állam Irányítórendszerek és Rádióelektronikai Egyetem. 2013. 2. szám (28). 157–162.
Patel-Schneider P.F., Horrocks I. et al. SWRL: Az OWL-t és a RuleML-t egyesítő szemantikus webszabály nyelv // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (Hozzáférés dátuma: 2016.08.18.).
Fillmore Ch. Az eset esetre. Proc. Texas Symp. on Language Universals, 1967, 134 p.
Fillmore Ch. Az eset esete // Új a külföldi nyelvészetben. M.: Haladás, 1981. 369–495.
Dowty D. Tematikus protoszerepek és érvek kiválasztása // Language, 1991, vol. 67. sz. 3, pp. 547–619.
Norvig P., Russell S. Mesterséges intelligencia: modern megközelítés. M.: Williams, 2007. 1408 p.
Jurafsky D., Martin J. Beszéd és nyelvfeldolgozás: Bevezetés a természetes nyelvi feldolgozásba, a számítógépes nyelvészetbe és a beszédfelismerésbe. 2008, 1024 p.
Batura T.V., Murzin F.A. Géporientált logikai módszerek a szöveg szemantikájának természetes nyelven való megjelenítésére: monográfia. Novoszibirszk: NSTU Publishing House, 2008. 248 p.
Időbeli logika. URL: https://ru.wikipedia.org/wiki/Temporal_logic (elérés dátuma: 2016.08.23.).
Vendler Z. Igék és idők. The Philosophical Review, 1957, vol. 66. sz. 2, pp. 143–160.
Paducheva E.V. Lexikai aspektualitás és predikátumok osztályozása Maslov-Vendler szerint // Nyelvtudományi kérdések. 2009. No. 6. P. 3–21.
Következtetés logikai modellekben. Felbontási módszer. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (Hozzáférés dátuma: 2016.11.08.).
Boral H., Redfield S. Database Machine Morphology. Proc. 11. Gyakornok. Konf. Very Large Data Bases, 1985, pp. 59–71.
Fushimi S., Kitsuregawa M., Tanaka H. Egy párhuzamos relációs adatbázis-gép rendszerének áttekintése GRACE. Proc. 12. Gyakornok. Konf. Very Large Data Bases, 1986, pp. 209–219.
Tanaka H. Párhuzamos következtetés motor. IOS Press Publ., 2000, 296 p.
Nyissa meg a Kogníciót. URL: http://opencog.org/ (elérés dátuma: 2016. 08. 23.).
Link Grammar Parser. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (Hozzáférés dátuma: 2016. 08. 20.).
A CMU Link Grammar természetes nyelvi elemzője. URL: https://github.com/opencog/link-grammar/ (elérés dátuma: 2016. 08. 22.).
RelEx Dependency Relationship Extractor. OpenCog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (Hozzáférés dátuma: 2016.08.22.).
Sokirko A.V. Szemantikus szótárak automatikus szövegfeldolgozásban (a DIALING rendszer anyagai alapján). Diss. ...folypát. azok. Sci. M.: MGPIIYA, 2001. 120 p.
Automatikus szövegfeldolgozás. URL: http://www.aot.ruhttp://aot.ru/ (Hozzáférés dátuma: 2016. 08. 23.).
Prószéky G. Gépi fordítás és a szabályról szabályra hipotézis. Új irányzatok a fordítástudományban (Klaudy Kinga tiszteletére). Budapest: Akademiai Kiadó, 2005, pp. 207–218.

A FUNKCIONÁLIS-SZEMANTIKAI ELEMZÉS MINT A NYELVI EGYSÉGEK RENDSZERTANULMÁNYÁNAK ALAPJA. FUNKCIONÁLIS-SZEMANTIKAI ÖSSZEHASONLÍTÁSI KATEGÓRIA

Krylova Maria Nikolaevna
Azov-Fekete-tenger Állami Mezőgazdasági Mérnöki Akadémia
a filológiai tudományok kandidátusa, a Szakpedagógiai és Idegennyelvi Tanszék docense

annotáció
A cikk áttekintést ad a nyelvtudományi funkcionális-szemantikai megközelítés kialakulásának történetéről és ismerteti annak alapfogalmait. A modern orosz nyelv összehasonlítási kategóriájának szerkezetét funkcionális-szemantikai kulcsban vizsgáljuk.

FUNKCIONÁLIS-SZEMANTIKAI ELEMZÉS A NYELVI EGYSÉGEK RENDSZERES KUTATÁSÁNAK ALAPJÁN. FUNKCIONÁLIS-SZEMANTIKAI ÖSSZEHASONLÍTÁSI KATEGÓRIA

Krylova Maria Nikolaevna
Azov-Fekete-tenger Állami Agrármérnöki Akadémia
PhD filológiai tudományból, a Szakpedagógiai és Idegennyelvi Tanszék adjunktusa

Absztrakt
A dolgozat áttekinti a funkcionális-szemantikai megközelítés nyelvtudományi fejlődéstörténetét, ismerteti alapfogalmait. A modern orosz nyelv összehasonlítási kategóriájának szerkezete funkcionális-szemantikai módnak tekinthető.

Bibliográfiai link a cikkhez:
Krylova M.N. A funkcionális-szemantikai elemzés, mint a nyelvi egységek szisztematikus vizsgálatának alapja. Az összehasonlítás funkcionális-szemantikai kategóriája // Humanitárius kutatás. 2013. 9. szám [Elektronikus forrás]...2019.03.).

A modern nyelvészek kutatásában nagy jelentősége van a nyelvi tények és jelenségek funkcionális megközelítésének, mint „olyan megközelítésnek, amelyben a vizsgálat kiindulópontját egy bizonyos általános jelentésként ismerik fel, majd különféle többszintű nyelvi eszközöket hoznak létre. amelyek ennek az általános jelentésnek a kifejezésére szolgálnak.” Ez a megközelítés a funkcionális nyelvészet jegyében végzett nyelvkutatásból következik.

A funkcionális nyelvészet számára a fő jellemző a nyelv, mint kommunikációs eszköz működésére való figyelem. A szerkezeti nyelvészet egyik ágaként alakult ki a huszadik század 50-60-as éveiben. A funkcionális rendszerszemléletű megközelítés előnye, hogy a nyelv minden egyes jelenségét mind belső szerkezetük, mind működésük szempontjából vizsgálhatjuk. A nyelvet konkrét helyzetben, cselekvésben, különféle nyelvi jelenségek szoros összefüggésében tanulmányozzák. M.G. meggyőzően beszél arról, hogy a kutatóknak a nyelv funkcionális oldala felé kell fordulniuk. Petrosyan: „A funkcionális megközelítés... lehetővé teszi, hogy egy tárgyat ne a belső szerkezete, hanem a működése, a környezettel való kapcsolatai szempontjából vizsgáljunk... Lehetővé teszi a nyelv tanulmányozását annak sajátos megvalósításában , működés közben, a nyelven kívüli helyzetek közvetítésének nyelvi eszközeinek feltárására... Megfelel a beszédkommunikáció természetes feltételeinek „amikor a különböző nyelvi eszközöket a szintézisben, azok elválaszthatatlan összefüggésében használjuk”.

A funkcionális-szemantikai megközelítés, és ennek megfelelően a funkcionális-szemantikai mező (FSF) fogalma a nyelvnek, mint összetett mechanizmusnak számító rendszernek az elemzéséig nyúlik vissza, amit I.A. elméletileg bebizonyított. Baudouin de Courtenay és F. de Saussure. Jelenleg a nyelv szisztematikus jellegét az orosz és a külföldi nyelvészek egyaránt elismerik.

A külföldi nyelvészetben a terepelméletet J. Trier és W. Porzig német tudósok tanulmányozták. A főként lexikális anyagot tanulmányozva ezek a tudósok kidolgozták a lexikális területek elméletét, amely paradigmatikus (J. Trier) és szintagmatikai (W. Porzig) elvekre épült.

A hazai nyelvészek (V.G. Admoni, I.P. Ivanova, E.V. Gulyga, M.M. Gukhman, G.A. Zolotova stb.) sokat tettek a funkcionális nyelvészet és a terepelmélet fejlesztéséért. V.G. Admoni nagy jelentőséget tulajdonított a nyelvi jelenségek rendszerszintű észlelésének: „Egy nyelv létezésének teljességében véve változatos egységek összetett, szervesen összekapcsolódó halmazát képviseli.” Különösen fontosak az A.V. Bondarko, aki alátámasztotta a funkcionális nyelvtan alapelveit, a funkcionális-szemantikai mező fogalmát és az FSP tipológiáját javasolta az orosz nyelvben. A.V. Bondarko a funkcionális nyelvtan feladatait úgy fogalmazta meg, mint „a nyelvtani egységek működésének dinamikus aspektusának fejlesztése a nyelv különböző szintű elemeivel való kölcsönhatásban, amelyek részt vesznek egy állítás jelentésének kifejezésében”. A többszintű egységek csoportosításának leírásánál a funkcionális megközelítést indokolta: „... A domináns elv a jelentésközvetítés igénye, erre a célra különböző szintű eszközöket használnak, szemantikai alapon szervezve. A funkcionális nyelvtant és a morfológiai mező, mint a funkcionális-szemantikai mező alrendszerének fogalmát I.P. Ivanova: „Minden beszédrészben vannak olyan egységek, amelyek teljes mértékben rendelkeznek egy adott beszédrész összes jellemzőjével; úgyszólván ez a lényege. De vannak olyan egységek is, amelyek nem rendelkeznek az adott szófaj összes jellemzőjével, bár hozzátartoznak. A mező tehát központi és perifériás elemeket tartalmaz, összetételében heterogén.

E.V. Gulyga egy másik nevet javasolt az FSP-nek - grammatikai-lexikális: „A nyelvtani és lexikális szint különféle eszközei, amelyek az általános jelentések kifejezésére és megnevezésére szolgálnak, nem véletlenszerű kapcsolatokon kapcsolódnak egymáshoz, hanem olyan kapcsolatokhoz, amelyek lehetővé teszik bizonyos minták létrehozását. A kölcsönhatásban lévő eszközök halmaza egy rendszert alkot - egy nyelvtani-lexikai mezőt." A kifejezés, amelyet E.V. Gulyga, E.I. Schendelék nem vették meg a lábukat a nyelvészetben, azonban az általuk megfogalmazott terepvonások relevánsak a nyelvtudomány jelenlegi fejlődési szakaszában.

Az orosz nyelvészetben a jelenségek mezőszerkezetének fogalma egy nyelv grammatikájában V.G. Admoni, aki egy centrumot (mag, mag) és perifériát azonosított a mező szerkezetében. Ezt az ötletet sok nyelvész dolgozta ki, például M.M. Gukhman ezt írja: „A mező hierarchikusan egyenlőtlen összetevőket tartalmaz: a magját alkotó és központi helyet foglaló egységek mellett különféle típusú formációkat takar, amelyek a periférián helyezkednek el, többé-kevésbé közel a mezőt alkotó maghoz.” A.V. Bondarko megjegyzi: "Az FSP magja (középe) a nyelv azon egysége, amely a leginkább specializálódott egy adott szemantikai kategória kifejezésére." A központot az adott nyelvi egységre jellemző összes jellemző legjobb koncentrációja jellemzi. A perifériás egységekben egy vagy több jel hiányának jelensége figyelhető meg.

Az FSP szerkezeti tipológiája (A.V. Bondarko szerint) a következő:

1. Monocentrikus mezők (erősen középre állított) mezők, amelyek erős középpontra támaszkodnak - nyelvtani kategória. Az orosz nyelvben ezek az aspektualitás, az időbeliség, a modalitás, a biztosíték és az összehasonlíthatóság.

2. Policentrikus mezők (gyengén központúak), amelyeknek nincs erős középpontja. Oroszul ez a taxik, létezőség, állapot, szubjektivitás, objektivitás stb.

A nyelvi egységek mező formájában való figyelembevételét terepi megközelítésnek nevezzük. Yu.N. Vlasova, A.Ya. Zagoruiko ezt írja: „Kezdetben lexikai szinten használták a lexikai egységek szemantikájának tanulmányozására. Ezt követően a mező fogalma jelentősen bővült, más szintű, elsősorban nyelvtani egységekkel kapcsolatban kezdték használni.

A modern nyelvészet jelentős tapasztalatot halmozott fel a különféle funkcionális szemantikai kategóriák (FSK) vagy területek összetételének komplex elemzésében. L.A. Brusenskaya az orosz számkategóriát funkcionális és szemantikai szempontból vizsgálta (1994); A.G. Narusevics leírta az élő-élettelen kategóriát (2001); M.Yu. Romenszkaja elemezte a tilalom FSP-jét modern orosz nyelven (2002); E.Yu. Dolgova az orosz nyelv személytelenségének kategóriáját, működésének jellemzőit veszi figyelembe (2008). A „Modern orosz nyelv: kommunikációs és funkcionális szempont” (2000) című tankönyv szerzőinek csapata nagymértékben hozzájárult a különböző szemantika FSK leírásához. Ebben a kézikönyvben G.F. Gavrilova elemzi az FSK intenzitását (összetett mondatban) és imperativitását; DE. Grigorjeva – FSK modalitás és személyiség, L.V. Marchenko – minőségi kategória; T.L. Pavlenko – FSK intenzitás; A.F. Pantelejev – az időbeliség és a taxik kategóriái stb.

Megjelentek olyan művek, amelyekben egy bizonyos FSK-t egy adott szerző vagy mű nyelve alapján elemeznek: ; ; egy adott kategória egyes nyelvi összetevői, például mérték és fok határozói a fokozatosság kategóriájának kifejezéseként: stb.

Érdekesek azok a művek, amelyek szerzői összehasonlítják az FSP-t és kifejezési eszközeiket különböző nyelveken. E.V. Korneva a reflexivitás szemantikai kategóriáját a funkcionális-szemantikai mezők elmélete szempontjából vizsgálja, feltárja a reflexivitás nemzeti sajátosságait az orosz és a német nyelvben. V.V. Beszkrovnaja összehasonlítja az orosz és angol nyelvű lokativitás FSP-jét, arra hivatkozva, hogy „a nyelvi jelenségek összehasonlító megközelítése lehetővé teszi számunkra, hogy mélyebben megértsük őket, és beazonosítsuk beszédhasználatuk mintáit”.

Az FGC és az FSP fogalmak fejlesztése és pontosítása folyamatban van. Például S.G. Agapova a „funkcionális-pragmatikus mező” kifejezést használja, és egy adott terület megvalósításaként értelmezi egy nyilatkozatban, a társadalomban elfogadott beszédviselkedési elvek és szabályok függvényében.

Ebben a helyzetben az FSK-összehasonlítás (összehasonlítás) fejlesztése időszerűnek és logikusnak bizonyul, mivel M.I. Cheremisina, „ha a klasszikus szintaxis felől nézzük az összehasonlítás kategóriáját, akkor elkerülhetetlenül a szintaktikai formák tarka változatosságaként jelenik meg, amelyet csak a funkcionális közösség egyesít. Mindegyik egy bizonyos általános szintaktikai jelentést fejez ki, amelyet intuitív módon megragadnak és „összehasonlításként” értékelnek.

A modern német nyelv nyelvi alapjain az FSP-összehasonlítást E.V. Gulyga, E.I. Schendels, a mező alkotóelemeinek, szemantikai mikromezőinek megállapítása, valamint a melléknevek és határozószavak összehasonlítási fokának domináns felismerése. Felfogták az összehasonlítás funkcióit is: „Helytelen lenne azt hinni, hogy az összehasonlítás funkciója pusztán stilisztikai jellegű. Azáltal, hogy a tárgyakat minőségük szerint hasonlítjuk össze egymással, megállapítjuk egymáshoz való hasonlóságukat, mélyebben tárjuk fel az objektív valóság jelenségeit.”

Yu.N. munkáiban kísérletek történtek a funkcionális összehasonlítási mező leírására az orosz nyelv anyagával. Vlasova, M.I. Konyushkevich, O.V. Kravets, A.V. Nikolaeva, E.M. Porksheyan, E.V. Skvoretskaya és mások például E.V. Skvoretskaya, E.V. terminológiáját használva. Gulyga megjegyzi: „A grammatikai-lexikai mező elmélete szerint az összehasonlítás kifejezésének minden eszköze kölcsönhatásban van egymással és együtt működik, összehasonlító mezőt alkotva.” O.V. Kravets maximálisan felosztja a mezőt különböző szintű mikromezőkre, a valós és irreális összehasonlítást a hasonlóság mikromezőjének összetevőjeként elemzi, és arra a következtetésre jut: „Az FSPK (funkcionális-szemantikai összehasonlítási mező – M.K.) egy vegyes típusú mező. Bonyolult, többszintű felépítése lehetővé teszi a mikromezők megkülönböztetését a mező legmagasabb szintjein az ontológiai rétegződésű mező, az alacsonyabb szinteken pedig az episztemológiai rétegződésű mező elve szerint.”

A funkcionális megközelítés szempontjából az összehasonlíthatóság kategóriájának szemantikai lényege a „minőségi és mennyiségi kategóriákkal való metszéspontok” jelenlétében rejlik, aminek megerősítését látjuk a fő funkciók összehasonlításában - leíró. , jellemző, kiválasztó, értékelő.

Az összehasonlítás FSK-ját az összehasonlító szemantika formális kifejezésének sokféle módja jellemzi. Az összehasonlítás különböző nyelvi szinteken figyelhető meg: lexikai, morfológiai, szintaktikai. Az összehasonlító szemantika kifejezési módszereit általában kötőszókra osztják (összehasonlító kötőszók segítségével mintha, pontosan, mintha, mintha, mintha stb.) és nem szakszervezet. Az összehasonlítások a teljesség, az összes komponens jelenléte szempontjából is osztályozhatók. Azokat az összehasonlításokat, ahol van operátor és összehasonlítási alap, a nyelvészetben általában explicitnek nevezik: összehasonlító tagmondatoknak, összehasonlító kifejezéseknek. Azokat az összehasonlításokat, ahol a modul és/vagy operátor kimarad (nem formálisan kifejezve, hanem implikáltan), implicitnek nevezzük: az alkalmazás, predikátum, instrumentális eset és egyéb konstrukciók formájában történő összehasonlítások.

Összefoglalva és kiegészítve a fenti tanulmányokat, mutassuk be az FSK felépítését a modern orosz nyelv összehasonlítására a következő formában.

MagAz FSK összehasonlítások olyan konstrukciókból állnak, amelyek ezt a szemantikát a lehető legteljesebben reprezentálják. Véleményünk szerint ezek közé tartoznak a mellékmondatok (teljes és hiányos) és az összehasonlító kifejezések, mint a nyelv leggyakoribb szintaktikai egységei, amelyeket a legtöbb szerkezeti és szemantikai jellemző jellemez. Úgy gondoljuk, hogy az összehasonlítás a szintaxis és a mondatalkotás szintjén fejeződik ki a legvilágosabban és a legmegfelelőbben, az összehasonlító konstrukcióban a logikai szerkezetének minden eleme jelenik meg. Periféria Az összehasonlítás FSK tartalmazza az összehasonlító szemantika nyelvtani és lexikai szintű kifejezésének minden egyéb módját:

Nem unió összetett mondatok a részek párhuzamosságával.

Összetett névleges állítmány kötő része.

Elöljáró-kisbetű kombinációk prepozíciókkal hasonló, hasonló stb.

Melléknév vagy határozószó összehasonlító fokának összevonása főnévvel. R. P.

Főnevek hangszeres esetben.

Melléknév vagy határozószó összehasonlító és felsőbb foka.

Összehasonlító határozók.

Típusonként felépített negatív összehasonlítások nem, de.

Összehasonlítások pályázatok formájában.

Genitív konstrukciók.

Melléknév kombináció hasonlóürüggyel tovább.

Összehasonlítások összehasonlító szemantika igék segítségével.

Összehasonlítások névelők formájában.

Összehasonlítások összehasonlításokkal. részecskék mintha, pontosan, mintha, tetszikés alatta.

Demonstratív szavakat tartalmazó szerkezetek.

Lexikai összehasonlítások szavak használatával formában, színben, formában.

Az ilyen szerteágazó szerkezetű nyelvi elemek elemzésekor a funkcionális-szemantikai megközelítést részesítjük előnyben, mivel „segíti a jelentésekre vonatkozó hagyományos információeloszlás közös fogalmi kategória alapján történő kritikus megközelítését”. Mindazonáltal az egyik vagy másik nyelvkategóriáról más megközelítéssel nyert adatok bevonása is szükséges. Amint azt korábban megjegyeztük, „ennek a módszernek a nyelvkulturális elemzéssel való kombinációja lehetővé teszi az összehasonlítás funkcionális-szemantikai kategóriájának átfogó mérlegelését, amely különböző nyelvi szinteken (lexikai, morfológiai, szintaktikai) megnyilvánul, és azonosítani képes a legpontosabb képet nyújtani. a kulturális konnotációk nyelven keresztüli megvalósításáról.”

Tehát a nyelvi jelenségek tanulmányozásának funkcionális-szemantikai megközelítése magában foglalja a többszintű, szemantikailag egyesített nyelvi eszközök átfogó mérlegelését. Lehetővé teszi a nyelv mezőszerkezetének áttekintését, a nyelvi rendszer szigorának megértését, valamint a jelentésközvetítés során a különböző szintű eszközökkel való működés okainak megértését.

Nem elég azonban csak erre a megközelítésre szorítkozni, ha egy olyan összetett és sokrétű jelenséget vizsgálunk, mint az FGC összehasonlítás; Nagyon fontosnak tartjuk a funkcionális-szemantikai megközelítés és a nyelvkultúrológiai megközelítés ötvözését.

Bibliográfia

Romenskaya M.Yu. A funkcionális-szemantikai tilalommező közvetett tiltásának mikromezeje a modern orosz nyelvben // Beszédtevékenység. Szöveg: Egyetemközi. Ült. tudományos tr. / Ismétlés. szerk. ON A. Senina. Taganrog: Taganrog Állami Kiadó. ped. Intézet, 2002. 185-189.
Petrosyan M.G. Funkcionális-szemantikai megközelítés az egzisztencialitás kategóriájának vizsgálatához // Végzős hallgatók és fiatal tanárok tudományos munkáinak gyűjteménye. 3. rész: Filológia. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem Kiadója, 1999. 98-111.
Admoni V.G. A nyelvtani szerkezet mint szerkesztési rendszer és általános nyelvtanelmélet. L.: Nauka, 1988. 239 p.
Bondarko A.V. Funkcionális nyelvtan. L.: Nauka, 1984. 134 p.
Ivanova I.P., Burlakova V.V., Pocsepcov G.G. A modern angol nyelv elméleti nyelvtana: Tankönyv. M.: Felsőiskola, 1981. 285 p.
Gulyga E.V., Shendels E.I. Nyelvtani és lexikai területek a modern német nyelvben. M.: Nevelés, 1969. 184 p.
Gukhman M.M. Az inflexiós rendszer és a mezőfogalom elemzési egységei // Fonetika. Fonológia. Nyelvtan: Cikkgyűjtemény. M.: Nauka, 1971. 163-170.
Bondarko A.V. Funkcionális-szemantikai mező // Nyelvészet. Nagy enciklopédikus szótár / Ch. szerk. V.N. Jartseva. M.: Nagy Orosz Enciklopédia, 1998. 566-567.
Vlasova Yu.N., Zagoruiko A.Ya. A különböző szintű mezők azonosításának elvei egy nyelvben // Nyelv. Társalgás. Szöveg: V.P. évfordulójának szentelt nemzetközi tudományos konferencia. Malascsenko: Eljárások és anyagok. 2 óra alatt 1. rész. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem Kiadója, 2004. P. 47-50.
Modern orosz nyelv: Kommunikációs-funkcionális aspektus: Tankönyv. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem Kiadója, 2000. 163 p.
Kokina I.A. Az intenzitás kategóriái és stilisztikai és kompozíciós funkcióik a művészi beszédben (A. P. Csehov „A sztyeppe” című művének nyelve alapján) // Végzős hallgatók és fiatal tanárok tudományos munkáinak gyűjteménye. 3. rész: Filológia. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem Kiadója, 1999. 77-84.
Ismagulova D.O. A lehetőség modális mikromezője I.S. regényében Turgenyev „Rudin” // A beszédkommunikáció problémái: Egyetemközi. Ült. tudományos tr. / Szerk. M.A. Kormilitsyna, O.B. Sirotinina. – Saratov: Sarat kiadó. Univ., 2008. évf. 8. Az International anyagai. tudományos-gyakorlati konf. "Az orosz beszéd jelenlegi állása: fejlődés, trendek, előrejelzések." 301-308.
Kim A.A. Az osztályozás kategóriájának nyelvi kifejezése mérték és fokozat határozóival // A nyelv egységei: funkcionális-kommunikatív aspektus (Az egyetemközi konferencia előadásai). 1. rész. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem kiadója, 2001. 143-145. o.
Korneva E.V. A reflexivitás funkcionális-szemantikai mezőinek összehasonlító elemzése az orosz és a német nyelvben // Elméleti és alkalmazott nyelvészet. 1. kérdés Nyelvfilozófia és összehasonlító nyelvészet problémái. Voronyezs: VSTU Kiadó, 1999. 81-94.
Beszkrovnaja V.V. Összehasonlító megközelítés a lokativitás funkcionális-szemantikai területének vizsgálatához // II G. F. professzor évfordulójának szentelt nemzetközi tudományos konferencia. Gavrilova: Eljárások és anyagok. 2 órakor.én . Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem Kiadója, 2005. 33-35.o.
Agapova S.G. A funkcionális-pragmatikai mezők problémájáról // A nyelv egységei: funkcionális-kommunikatív aspektus (Az egyetemközi konferencia előadásai). 1. rész. Rostov-on-Don: Az Orosz Állami Pedagógiai Egyetem kiadója, 2001. 145-149.
Cheremisina M.I. Az orosz nyelv összehasonlító szerkezetei; Ismétlés. szerk. K.A. Timofejev. Novoszibirszk: Nauka, 1976. 270 p.
Skvoretskaya E.V. Az összehasonlítás-kontraszt kifejezésének eszközrendszere az orosz irodalmi nyelvben XVIII század // Az orosz nyelv szintaxisának kérdései / Szerk. V.M. Nikitina. Vol. 2. Ryazan: RGPI, 1974. P. 107-113.
Kravets O.V. Az összehasonlítás funkcionális-szemantikai mezőjének hasonlósági mikromezeje (valódi összehasonlítás) a modern orosz nyelvben // Beszédtevékenység. Szöveg: Egyetemközi. Ült. tudományos tr. / Ismétlés. szerk. ON A. Senina. Taganrog: Taganrog Állami Kiadó. ped. Intézet, 2002. P. 100-105.
Nikolaeva A.V. Az összehasonlíthatóság, a minőség és a mennyiség funkcionális-szemantikai kategóriái közötti kapcsolatról // A nyelv egységei: funkcionális-kommunikációs aspektus (Az egyetemközi konferencia előadásai) 1. rész. Rostov-on-Don: RGPU, 2002. 173-176. .
Brusenskaya L.A. A számkategória értelmezésének szemantikai és funkcionális vonatkozásai az orosz nyelven. Absztrakt... Dr. Philol. Sci. Krasznodar, 1994. 43 p.
Krylova M.N. A funkcionális-szemantikai és a nyelvi-kulturális elemzés kombinációja a modern orosz összehasonlítás tanulmányozásában // A tudomány és az oktatás innovációi és hagyományai. A II. Összoroszországi Tudományos és Módszertani Konferencia anyagai. 2. rész / Szerk. S.V. Lesnikova. Sziktivkar: Sziktivkar állam. Univ., 2011. 277-286.

A kiadvány megtekintéseinek száma: Kérlek várj

A BESZÉDRÉSZEK OSZTÁLYOZÁSÁNAK SZEMANTIKAI ELVE

Számos alapelv létezik a teljes értékű szavak kategóriákra való felosztására. Ezen elvek egyike a szemantikai elv. Különösen figyelembe vették (Panov M.V. Az orosz nyelv beszédrészeiről // Felsőiskolai tudományos jelentések. Filológiai tudományok, 1960, 4. sz.). Az elgondolás szerint a beszédrészeknek bizonyos közösséggel kell rendelkezniük, és ez a közösség ne gyökér, hanem toldalékos legyen, és ne a toldalékok hangjára (formájára), hanem jelentésükre (tartalmukra) vonatkozzon. Valójában szóalakok gyáva, gyáva,gyáván, bár közös gyökmorfémával rendelkeznek, nem sorolhatók be a beszéd egyik részébe. Szóalakok írtÉs madárijesztő, álmosÉs nyomja, fagyiÉs nagy, bár formailag azonos toldalékelemeket tartalmaznak -l-, -n~, -oe, nyilvánvalóan a beszéd különböző részeihez tartoznak. Ezért fel kell fedezni valami értelmes toldalékközösséget, amely a szavak szórészekre bontásának alapjául szolgáljon.

A besorolás egy rendkívül általános jelentésen – a névadó funkcióban való részvételen – alapul. Számos ilyen funkció létezik. Egyikük - procedurális- bármilyen verbális szóalakban látható, függetlenül a gyök jelentésétől, aminek esetleg nincs procedurális jelentése. Egyéb funkció - jel. A függvények hierarchiájában a folyamat után következik. A procedurális funkció hiánya és az attribútum funkció megléte alapján a melléknév beszédrészként megkülönböztethető. Ugyanakkor az igenévet nem emelik ki beszédrészként, mivel procedurális funkciója van. Ez a körülmény az alapja annak, hogy a melléknévi alakokat beszédrészekké minősítsük. A harmadik funkció az objektumhoz való közvetlen vagy közvetett kapcsolat. Ezen az alapon a melléknév és az ige szembeállítása a határozószóval. Az elsők közvetlenül jellemzik a tárgyat: a melléknév nem folyamati, az ige (résznévi igenévvel!) procedurális. A határozószó nem közvetlenül jellemez egy tárgyat, hanem magának a jellemzőnek, azaz egy ige vagy egy melléknévnek a funkcióját tölti be. Az attribútum attribútumának ugyanazt a funkcióját a gerund is ellátja. A határozószavakkal ellentétben azonban a gerundoknak procedurális természetük van.

Azok a szóalakok, amelyek toldalékrészükben nem rendelkeznek a jelzett jelentésekkel, azok a főnevek, amelyek a kérdés ily módon történő feltevésénél sarkalatos és gyűjtőszámokat tartalmaznak. A szóalakok közötti összes többi nyelvtani különbség nem befolyásolja a szófajok azonosítását.

Korábban hasonló - funkcionális-szemantikai - megközelítést alkalmaztak az orosz nyelvű beszédrészek azonosítására . Hajlamos volt megkülönböztetni négy független beszédrészt az orosz nyelvben: főnév, melléknév, ige és határozószó. A lexémák általa azonosított szemantikai-funkcionális kategóriáinak mérlegelése alapján azonban sikerült feszült helyet felfedezni az így azonosított orosz szórészek rendszerében. Fázisokat néz futni egy versenytÉs versenyt futni. Az első kifejezés lexikailag és nyelvtanilag is természetes. A második kifejezés is lexikailag természetes. De nyelvtanilag illegális: verseny- határozószó, azaz jel jele, de fuss- főnév, azaz nyelvtanilag nem jel vagy folyamat. Kolokáció gyorsan fut- lexikailag és nyelvtanilag is konzisztens. Kolokáció gyors futás nyelvtanilag is logikus, de lexikailag - nem, mert lexikailag fuss nem valami objektív. Így a melléknevek és határozószók szembenállása a vizsgált aspektusban kissé elmosódottnak bizonyul. Számos példát lehet hozni arra, amikor egy határozószó jelként működik a következővel kapcsolatban

közvetlenül egy főnévre: rántotta,legénység vágott haj, sikló farok stb.

A hagyományosan azonosított beszédrészekhez képest a javasolt séma bizonyos jellemzőkben eltér. Ebben a sémában nincsenek névmások vagy számnevek. Ezek a veszteségek azonban logikailag elkerülhetetlen következményei a felosztás szemantikai-funkcionális elvének következetes alkalmazásának. Ennek az elvnek megfelelően az összes hagyományosan kiosztott névmást a főnevek, melléknevek és határozószavak között osztják el. A számok sorsa ugyanaz. A rendesek a melléknevekben, a mennyiségiek és a gyűjtőnevek a főnevekben, a szóalakok pedig, mint pl. kétszer, háromszor, bár a számoláshoz kötődnek, mivel hagyományosan a határozószókkal kapcsolódtak, a jelzett megközelítés mellett is megmaradnak a határozók között. Az „elnevezési funkció” elve szerinti osztályozás csak rendkívül általános jelentéseiben ad a hagyományos szófajokra emlékeztető sémát. Az ezen az elven alapuló osztályozás elvileg részletezhető. Ezután olyan lexémacsoportok (vagy szóalakok) azonosításához vezet, amelyek funkcionális és szemantikai közösséggel rendelkeznek. Így például a határozószavakon belül megkülönböztethetők a személyes és személytelen igék csoportjai, a jellemző tulajdonságot jelző határozók csoportja és az állapotot jelző határozói csoport; (Fázom, neki nincs ideje) stb.

A figyelembe vett osztályozás objektív értéke, valamint a szemantika és szintaxis szempontjából különleges jelentősége ellenére nem elégítheti ki teljes mértékben a morfológia szakterületét, mivel nem veszi kellőképpen figyelembe az adott lexémacsoportban képviselt vagy nem képviselt morfológiai kategóriákat. vagy szóalakok. Ez utóbbi körülmény - a szavak tényleges morfológiai jellemzői - alapul szolgálhat a szófajok eltérő azonosításához.

A BESZÉDRÉSZEK OSZTÁLYOZÁSÁNAK morfológiai elve

UGYANAZ A MORFOLÓGIAI KATEGÓRIA KÉSZLETE. A lexémák osztályozása ugyanazon morfológiai kategóriák kifejezésén alapulhat. Ebben az esetben a lexémák ház, állat, tél egy csoportot alkotnak, mert minden szóalakjuk a szám, az eset morfológiai kategóriáit fejezi ki, és csak ezeket a kategóriákat. Másrészt mindezek a lexémák szemben állnak a lexémákkal kedves, öreg, nagy, hiszen ez utóbbiak minden szóalakja olyan morfológiai kategóriákat fejez ki, mint nem, szám, eset, rövidség-teljesség.

Az „azonos morfológiai kategóriák súlyossága” elve szerinti osztályozás azonban nem mindig vezet olyan egyértelmű eredményre, mint a főnevek és melléknevek fentebb leírt esete. Fő

Nagy nehézségek merülnek fel, ha egy lexéma különböző szóalakjai különböző morfológiai kategóriákat fejeznek ki.

A legösszetettebb szerkezet ebben a tekintetben az orosz nyelvben a hagyományosan az igében szereplő szóalakok. Még a jelen és a múlt idő alakjai is különböznek a kifejezett morfológiai kategóriák halmazában. A jelen a múltban hiányzó személy kategóriáját fejezi ki. A múltban pedig a jelenben hiányzó nemi kategóriát fejezték ki. Az igék morfológiai kategóriái a jelző, a kötőszó és a felszólító alakban nem esnek egybe. Még szembetűnőbbek az ige és a főnévi igenév személyalakjainak, az ige és a melléknévi igenevek személyalakjainak, az infinitivusnak és a mellékmondatnak a morfológiai kategóriáinak halmazai közötti különbségek. Mindezzel együtt mind az összes mód infinitivus és személyalakja, mind a melléknév, mind a gerund egy lexéma szóalakjainak tekintendők, hiszen az ezeket a szóalakot megkülönböztető jelentések kötelezőnek és szabályosnak tekinthetők (erről bővebben lásd az „Ige” részben). Ebből a körülményből következik, hogy az „azonos morfológiai kategóriák kifejezése” elve szerinti osztályozás következetesen csak szóalakra nézve végezhető. A lexémák esetében az ilyen osztályozás elvileg lehetetlen.

Egy másik körülmény megnehezíti ennek a kritériumnak az alkalmazását. Ez abban rejlik, hogy az orosz lexémák között sok olyan van, amely egyetlen szóalakból áll, és ezért nem fejez ki egyetlen morfológiai kategóriát sem. Tokenek, mint pl kabát, taxi, víz, a „morfológiai kategóriák kifejezésének” elve szerint élesen szemben állnak az orosz főnevek többségével, amelyek szóalakjukban mind a szám-, mind a kisbetűs morfológiai kategóriákat fejezik ki. Tokenek típusú bézs, khaki, szemantikailag azonosak a melléknevekkel, nem rendelkeznek a melléknevekben rejlő morfológiai kategóriákkal. Ezért a „morfológiai kategóriák kifejezésének” elve szerinti osztályozás csak a nyelvtanilag képzett szóalakra vonatkozóan lehetséges.

Ebben az esetben a következő típusú szóalakok kerülnek bemutatásra:

1) főnevek (kifejezett nagybetűk és számok); Ide tartoznak a mennyiségi és gyűjtőnevek is;

2) melléknevek (nagybetű, szám, nem és rövidség/teljesség);

3) infinitivusok (kifejezett aspektus és hang);

4) igenevek (kifejezett aspektus);

5) melléknevek (kifejezett kisbetű, szám, nem, rövidség/teljesség, típus, hang, igeidő);

6) a jelen/jövő idő jelzőhangjának igék (kifejezett szám, aspektus, hang, idő, személy, hangulat);

7) a múlt idejű jelzőhangú igék (kifejezett szám, nem, aspektus, hang, idő, hangulat);

8) kötőszó igék (szám, nem, aspektus, hang, hangulat);

9) felszólító igék (számot, aspektust, hangot, személyt, hangulatot fejez ki);

10) nyelvtanilag jellemzetlen szóalakok: lefordíthatatlan főnevek és melléknevek, összehasonlító fok és határozószók.

Pontosan így kell kinéznie az orosz nyelv független beszédrészeinek, ha azonosításuk egyetlen jellemzőn alapulna - magában a szóalakban kifejezett közös morfológiai jellemzők jelenlétén.

A hagyományos beszédrészekkel összehasonlítva ez a besorolás tömörebbnek bizonyul egy név esetében (nincs különböző névmások, fő- és sorszám-kategóriák), és sokkal kevésbé tömör egy ige esetében.

UGYANAZ A PARADIGMA TAGOK. A beszédrészek azonosításának morfológiai megközelítésén belül más osztályozás is lehetséges. A paradigma szerkezeti sajátosságaira alapozható. Nyilvánvaló, hogy ebben az esetben például a főnevek ellentétesek lennének a melléknevekkel. Utóbbi paradigmájába ugyanis beletartozik a szóalakok nemek szerinti szembeállítása, ami a főnevekben hiányzik. Igaz, ebben az esetben sem a főnevek, sem a melléknevek nem tudnák megőrizni egységüket. Ráadásul az ilyen töredezettség nemcsak a megváltoztathatatlan főnevek és melléknevek miatt következne be. A főnevek közül a lexémák egy nagy csoportját, amelyeknek csak egy szám alakja van (egyes vagy többes szám, nem számít), szembe kell állítani azokkal a lexémákkal, amelyeknek mindkét szám alakja van. (ház-házakÉs ifjúság, tej). Aztán a lexémák kategóriájában mint fiatalság, tej Szükséges lenne számnevek - gyűjtő és mennyiségi, valamint személyes és kérdő névmások szerepeltetése. Hiszen ezeknek a lexémáknak csak egyszámú szóalakja van.

A melléknévi lexémák három részre oszthatók: rövid és teljes szóalakot tartalmazó lexémákra (fehér), lexémák csak teljes szóalakkal (nagy), csak rövid szóalakkal rendelkező lexémák (boldog).

A szóalakkészlet természetéből adódóan a főnevekkel és a melléknevekkel szemben az igét ebben az esetben több csoportra kell osztani, attól függően, hogy egy aspektuspár van-e vagy nincs, a passzív hang személyalakja, bizonyos részes igenévek és gerundok. stb.

A BESZÉDRÉSZEK OSZTÁLYOZÁSÁNAK SZINTAKtikai elve

Nem szabad megfeledkeznünk arról, hogy a beszédrészek azonosításának tényleges morfológiai megközelítése a megváltoztathatatlan szavakkal szemben teljesen tehetetlen. Itt csak szemantikai és szintaktikai megközelítések lehetségesek.

Ha nem változtatható szavakra, azaz egy szóalakot tartalmazó lexémákra alkalmazzuk, a szintaktikai elv nagyon hatékonynak bizonyul. Ennek az elvnek a lényege, hogy meghatározzuk azokat a lexématípusokat, amelyekkel a számunkra érdekes szavak kombinálhatók vagy nem, valamint megérteni, hogy ezek a szavak milyen funkciókat töltenek be egy mondatban. Így a megváltoztathatatlan szavak között a főneveket főnevekkel, melléknevekkel és igékkel kombinálják (Szibériai HPP, Krasznojarszkvízerőmű, vízerőmű építése), alany, állítmány, tárgy, meghatározás, körülmény; melléknevek főnevekkel kombinálódnak (bézs öltöny), definíció vagy állítmány; határozószók igékkel és melléknevekkel kombinálódnak (öltözve, mint a nyár, melegen, mint a nyár), különböző típusú körülmények.

Ezenkívül ez a felosztási elv megköveteli, hogy a megváltoztathatatlan szavak között az úgynevezett összehasonlító fokozatok speciális osztályaként ismerjék el, összehasonlító. Ezeket a szavakat, ellentétben a főnevekkel, melléknevekkel és határozószavakkal, csak igékkel és főnevekkel kombinálják (százöregszik, a testvér idősebb, mint a nővér). Ezen túlmenően a szintaktikai kritérium használata megköveteli egy olyan szócsoport kiválasztását, amely csak a mondat egészére vonatkozik (talán talánnem, persze, mire jó stb.). Ezeket a szavakat általában modális szavaknak nevezik. Így a szintaktikai kritérium használata lehetővé teszi, hogy beszédrészeket azonosítsunk a megváltoztathatatlan szavakból. Fontos megjegyezni, hogy a főnevek és melléknevek kiválasztása a megváltoztathatatlan szavak közül szemantikai ismérv alapján történhet. A szemantikai kritérium könnyen megkülönbözteti a határozószavakat a megváltoztathatatlan szavaktól. A határozószavak között azonban csak a szintaktikai kritérium alkalmazása vezet be különféle fokozatosságokat.

Az orosz nyelvtani irodalomban széles körben tárgyalták azt a kísérletet, amely a szóalakok osztályozásának szintaktikai elvén alapuló speciális beszédrész elkülönítésére irányult. Olyan szóalakokról beszélünk, amelyek nem verbálisak, hanem állítmányként használatosak (fázik, örülünk, neked kellene, lusta dolgozni, lusta beszélni stb.). Ezek a szóalakok egy speciális szórész, az úgynevezett állapotkategória státuszát kapták. Mindezen szóalakok egy beszédrésszel való kombinálása figyelembe veszi szintaktikai funkciójuk közösségét és az ehhez a közösséggel társuló bizonyos szemantikai homogenitást, amelyet már az „állapotkategória” elnevezésben is megjegyeznek. Morfológiailag ezek a szóalakok különbözőképpen jellemezhetők: Hideg nem fejez ki morfológiai kategóriákat, örülünk, kellene van számod lustaság, időhiány- szám, tok.

A szintaktikai elv következetes alkalmazása minden szóalakra paradox következtetésekhez vezet. Így például a rövid mellékneveket szembe kell állítani a teljes melléknevekkel. Az előbbi definícióként és állítmányként is működhet, míg az utóbbi csak állítmányként. A különböző igealakok - személyes, részleges, participiális - szintaktikai funkciói eltérően kerülnek meghatározásra. Igaz, a szintaktikai funkciók alapján a bíbor- és gyűjtőnevek szóalakjai szembeállíthatók magukkal a főnevek szóalakjaival: ismeretes, hogy a bíboros és a gyűjtőnevek nem kombinálhatók jelzőkkel.

Lehetséges, hogy a szintaktikai függvények lexémákkal kapcsolatos meghatározása ismertebb eredményeket hozhat? Ez rossz. Egy lexémán belül egymás mellett léteznek eltérő morfológiailag kialakított szóalakok. Ugyanígy ugyanannak a lexémának a különböző szóalakjai különböző szintaktikai funkciókat tölthetnek be. Ezért a lexémák esetében a „szintaktikai funkció” elvén alapuló osztályozás elvileg lehetetlen, ahogy a lexémák esetében sem a homogén morfológiai tervezésen alapuló osztályozás.

KÜLÖNBÖZŐ OSZTÁLYOZÁSOK EREDMÉNYEI

Levonhatunk néhány következtetést. A beszédrészek azonosításának problémája a szóalakok osztályozásának problémája.

A szemantikai kritérium a legáltalánosabb jelentéseiben kiemeli négy osztály teljes jelentésű szóalakok - főnév, melléknév, ige és határozószó.

A morfológiai kritérium kiemeli kilenc osztály formalizált szóalakok és formálatlan szóalakok.

A morfológiailag nem jellemzett csoportra alkalmazott szintaktikai kritérium lehetővé teszi, hogy ez utóbbiak között különbséget tegyünk főnevek, melléknevek, határozószók, összehasonlító (összehasonlító fok), állapotkategóriák és modális szavak között. A szintaktikai kritérium szóalakra elvileg alkalmazható, de eredményei ütközni fognak a morfológiai és szemantikai elemzés eredményeivel.

A BESZÉRDÉSZEK OSZTÁLYOZÁSÁNAK ÉS HAGYOMÁNYOS TANÍTÁSÁNAK ELVEI

A fentiekből kitűnik, hogy a beszédrészek hagyományos doktrínája a priori osztályozás, amelynek logikai alapjai nagyon heterogének. Ez a besorolás azonban lehetővé teszi, hogy bármilyen szóalakot vagy lexémát megfelelő kategóriába soroljunk. Van hely a főneveknek, mellékneveknek, számneveknek, igéknek és határozószavaknak. Ugyanakkor a logikai tökéletlenség miatt a hagyományos osztályozás különválasztja azt, aminek bizonyos logikai okokból együtt kell lennie.

Az iskolai számnevek például, amelyek szemantikai alapon kombinálják a bíboros gyűjtő- és sorszámneveket, morfológiai és szintaktikai közösségük ellenére elválasztják az utóbbit a melléknevektől. Az állam kategóriájának az orosz beszédrészek között való megkülönböztetésének vágya azzal magyarázható, hogy a „főnevek” kategóriában azonos szintaktikai funkciókkal rendelkező egységek is léteznek. (időhiány, lustaság),és a „melléknevek” részben (örülök, nagyon)és a „határozószavak” részben (unalmas, szórakoztató).

Pontosan az „a priori” természetben rejlik mind a beszédrészek hagyományos tanának erőssége – az évszázadok során igazolt bármely tárgy jellemzésének képessége –, mind pedig gyengesége, az osztályozás mögött meghúzódó logikai alapok kritikájára való nyitottsága. .

Nem hagyhatjuk figyelmen kívül a beszédrészek hagyományos osztályozásának még egy előnyét. Egyes egységek, bár logikusak maradnak, egyidejűleg egy és egy másik kategóriába sorolhatók. Ez nagyon kényelmes, mivel a beszédrészek rendszerének számos területén állandó átmenetek vannak (melléknevek főnevekké, melléknevek melléknevekké stb.).

Mindezek a körülmények előre meghatározzák a beszédrészekről szóló hagyományos tan életképességét.

Amint már említettük, a beszédrészek tana nemcsak a morfológia, hanem az orosz nyelv leírásának más szakaszai számára is fontos. A beszédrészek hagyományos tana nem tükrözi a fenti osztályozások egyikének eredményeit sem (hasonlítsa össze a szó meghatározásának kritériumaival), hanem egyfajta kompromisszum mindezen elvek között. Egy ilyen kompromisszum elérésében jelentős szerepe van annak, hogy a különböző okokból azonosított beszédrészek nagyon eltérő méretű csoportokat alkotnak. Hasonlítsa össze például a főneveket és az úgynevezett állapotkategóriát, ige- és módszavakat.

IRODALOM A TÉMÁHOZ

„A BESZÉDRÉSZEK MINT SZAVAK LEXIKAI-NYELVJEGYZÉKE”

Zhirmunskiy V.M. A beszédrészek természetéről és osztályozásukról - A könyvben: A beszédrészek elméletének kérdései a különböző típusú nyelvek anyaga alapján. L., 1965.

P a n o v M. V. Az orosz nyelvű beszédrészekről - A felsőoktatás tudományos jelentései. Philol. Tudományok, 1960, 4. sz.

S t e b l i n - Kamenskiy M.I. A beszédrészek kérdéséről - Vesztnik a Leningrádi Állami Egyetemről, 1954, 6. sz.

Shcherba L.V. Az orosz nyelvű beszédrészekről - A könyvben: Válogatott művek az orosz nyelvről. M., 1957. .-

Hasonló cikkek

Mi a szemantika egyszerű szavakban?

Idegen nyelvek, filológia és nyelvészet Az objektivitás elve: a mondatnak a benne szereplő nevekkel jelölt tárgyakról kell beszélnie, nem pedig magukról a nevekről. A Szék mondat helyesen megszerkesztett főnév. Elv...
A beszédrészek osztályozásának szemantikai elve

Absztrakt A cikk a szövegek szemantikai elemzésének problémáival foglalkozik. Különféle módszereket veszünk figyelembe: fogalmi függőségi diagramok és szemantikai hálózatok; lexikális függvényeken és témaosztályokon alapuló megközelítések; keret és...
Lengyelország tragédiája A lengyel gyalogos osztag a második világháború alatt

Kézfogás Edward Rydz-Śmigła lengyel marsall és Bogislaw von Studnitz német attasé között a függetlenség napi felvonuláson Varsóban 1938. november 11-én. Érdekes lenne megérteni, hogy a második világháború frontvonalának melyik oldalán...
Hogyan válasszuk ki a tökéletes szépségszakértőt: A végső útmutató

A szépségápolási szolgáltatások modern piaca olyan szakemberek széles skáláját kínálja, akik a legkülönbözőbb ügyfelek igényeit is kielégítik. A fodrászoktól és sminkesektől a manikűrösökig és kozmetikusokig - minden szakembernek megvan a maga...
Firenze ortodox templom

A firenzei Krisztus születése és Csodaműves Szent Miklós ortodox templom visszatért az orosz ortodox egyház karámához. Nem lenne boldogság, de a szerencsétlenség segítene." Ennek az orosz közmondásnak a szavai tökéletesen mutatják, hogy Isten...
Kossov Georgij Alekszejevics

Élete: 1855. április 4-én született Androsovo faluban, Orjol tartomány Dmitrov kerületében, papi családban. Egy vidéki iskola elvégzése után az Oryol Teológiai Szemináriumba került. A szeminárium felsőbb osztályaiban az Optina vén lelki fia lett...

A szervezés szemantikai alapelvei a következők: Mi a szemantika egyszerű szavakban? Egységes információs tér

Valamint más művek, amelyek érdekelhetik

Adatkonszolidáció

A tudás megszilárdítása

Egységes információs tér

Sokoldalúság és bővíthetőség

Környezetérzékeny adatmegjelenítés

Adatcsere-formátumok szabványosítása

Szemantikai technológiák a CAD-ban

Vállalati referenciaadat-kezelő rendszer Semantic

Szemantikai szövegelemzés módszerei és rendszerei

Irodalom

Hasonló cikkek

Mi a szemantika egyszerű szavakban?

A beszédrészek osztályozásának szemantikai elve

Lengyelország tragédiája A lengyel gyalogos osztag a második világháború alatt

Hogyan válasszuk ki a tökéletes szépségszakértőt: A végső útmutató

Firenze ortodox templom

Kossov Georgij Alekszejevics