GATE (텍스트 엔지니어링을위한 일반 아키텍처) 시작

폭로: 귀하의 지원은 사이트 운영을 유지하는 데 도움이됩니다! 이 페이지에서 권장하는 일부 서비스에 대한 추천 수수료가 발생합니다.


GATE (General Engineering for Text Engineering)는 인간 언어 처리, 분석 및 정보 추출에 사용되는 Java로 작성된 도구 모음입니다. GATE는 오픈 소스이며 무료이며 GNU LGPL (General Public License)에 따라 배포됩니다.

GATE는 웹 마이닝, 정보 추출, 채용, 의사 결정 지원 등과 같은 다양한 언어 처리 작업 및 응용 프로그램에서 사용됩니다..

GATE 연혁

GATE는 원래 영국 셰필드 대학교에서 개발되었으며 1995 년에 처음 릴리스되었습니다. GATE 개발은 초기 릴리스 이후 지속적으로 진행되어 왔으며, 2015 년 6 월 2 일자 GATE의 안정적인 최신 릴리스는 버전 8.1입니다..

핵심 개발 작업은 GATE 연구팀이 수행하며 많은 커뮤니티 기고자들의 지원을받습니다..

게이트 특징

GATE는 현재 영어, 스페인어, 중국어, 아랍어, 불가리아어, 프랑스어, 독일어, 힌디어, 이탈리아어, 세부 아노, 루마니아어 및 러시아어에 대한 분석을 지원합니다..

GATE는 TXT, HTML, XML, Doc 및 PDF와 같은 다른 형식의 텍스트 입력을 허용 할 수 있습니다. 지원되는 데이터베이스는 Java Serial, PostgreSQL, Lucene 및 Oracle입니다..

또한 GATE는 JDBC (Java Database Connectivity) API를 사용하여 상호 작용합니다..

수년간의 개발 끝에 GATE는 이제 개발자를위한 데스크톱 클라이언트, 워크 플로 기반 웹 응용 프로그램, Java 라이브러리, 아키텍처 및 세련된 프로세스를 포함하는 안정적이고 성숙한 휴먼 언어 처리 솔루션입니다..

게이트 개발자

GATE Developer는 인간 언어 처리 소프트웨어 구성 요소 작성을위한 그래픽 사용자 인터페이스 (GUI)를 제공하는 통합 개발 환경 (IDE)입니다..

GATE Developer는 거의 새로운 정보 추출 시스템 (ANNIE)이라는 번들 정보 추출 (IE) 구성 요소 세트와 함께 제공됩니다..

ANNIE는 토크 나이저, 가제트, 문장 스플리터, 스피치 태거의 일부, 명명 된 엔터티 변환기 및 신뢰 태깅으로 구성된 정보 추출 구성 요소 집합입니다..

게이트 팀웨어

GATE Teamware는 협업 언어 주석 및 큐 레이션을위한 웹 기반 관리 플랫폼입니다..

GATE Teamware를 사용하면 텍스트 주석을보고, 추가하고 편집하기 위해 웹 인터페이스를 사용하여 언어 처리에 분산 된 인력을 사용할 수 있습니다. 웹 기반 관리는 프로젝트 설정, 추적 및 관리에도 사용됩니다..

GATE Teamware 실행에 관심이있는 경우 GATE Cloud에서 미리 구성된 GATE Teamware 가상 서버를 미리 구성하여 구입할 수 있습니다. GATE Teamware는 오픈 소스이며 소스 포지에서 코드를 호스팅합니다.

게이트 내장

GATE Embedded는 Java로 구현 된 GATE의 언어 처리 클래스 라이브러리입니다. 모든 게이트 시스템에서 사용되는 객체 지향 프레임 워크이며 게이트 개발자의 핵심 요소를 형성합니다..

GATE Embedded를 사용하면 자신의 응용 프로그램에 언어 처리 기능을 추가 할 수 있습니다. 이것은 프로그래머에게 매우 유용한 도구이며 JAR (Java Archives) 세트로 제공됩니다..

게이트 사용

GATE는 가장 널리 사용되는 휴먼 언어 처리 도구 중 하나입니다. 또한 GATE는 모든 유사한 소프트웨어 솔루션 중에서 가장 큰 사용자 커뮤니티를 보유하고 있습니다. 광범위한 사용과 오랜 개발 역사 덕분에 GATE는 안정적이고 효율적이며 포괄적 인 언어 처리 솔루션이되었습니다..

GATE는 과학에서 언어 계산 실험에 사용되며, 실험의 반복성, 정량적 평가, 측정 및 협업을 제공합니다..

교육에서 GATE는 종종 자연어 공학 과정의 예와 연습에 사용됩니다..

GATE의 비즈니스 용도로는 고객 피드백 분석을위한 도구로 사용, 제약 연구에서 과학 문서에 주석을 달고 검색하기위한 GATE 사용, 미디어 및 저널리즘의 대규모 이미지 라이브러리에서 캡션 처리 등이 있습니다..

GATE를 사용하고 싶다면 간단합니다. GATE 설치 프로그램을 다운로드하여 실행 한 후 자세한 설치 지침을 따르십시오. GATE는 크로스 플랫폼 솔루션이므로 Java를 지원하는 모든 시스템에서 실행할 수 있습니다.

게이트 자원

휴먼 언어 처리와 관련된 계산 작업을 수행하는 경우 GATE 및 다음 리소스 중 일부를 자세히 살펴 봐야합니다.

  • GATE 홈페이지는 시작하기에 좋은 곳입니다. GATE 사용자 매뉴얼 및 기타 유용한 문서는 물론 GATE 지원 및 설치 파일, 데모 등을 찾을 수 있습니다..

  • GATE Public Wiki는 GATE 홈페이지에서도 액세스 할 수 있지만 GATE 교육 과정의 유용한 예제와 내용이 많기 때문에이를 공개하기로 결정했습니다..

  • American National Corpus 웹 사이트에는 기본 GATE 사용법에 대한 간단한 자습서가 있습니다..

게이트 북

휴먼 언어 처리 및 GATE를 다루는 책은 매우 드물지만 사용 가능한 책은 유용하고 인기가 있습니다. 다음과 같은 책을 권장합니다.

  • Cunningham, Maynard 및 Bontcheva의 GATE를 사용한 텍스트 처리 (2011) :이 책에는 GATE Developer 및 GATE Embedded 사용에 대한 안내서와 여러 언어 및 비정형 텍스트 모음과 같은 모든 주요 기능 영역에 대한 장이 포함되어 있습니다. 완전한 플러그인 문서. 책 내용의 대부분은 온라인 GATE 사용자 안내서에서 시작됩니다..

  • 검색 응용 프로그램 작성 : Manu Konchady의 Lucene, Lingpipe 및 Gate (2008) :이 책은 오픈 소스 소프트웨어를 사용하여 검색 응용 프로그램을 작성하는 실용적인 안내서입니다. Lucene, LingPipe 및 Gate는 강력한 검색 응용 프로그램을 구축하기 위해 널리 사용되는 오픈 소스 도구입니다. 건물 검색 응용 프로그램은 엔티티 추출, 음성 태그 지정, 문장 추출 및 텍스트 토큰 화를 포함하는 GATE의 기능을 설명합니다..

  • Graham Wilcock의 언어 ​​주석 및 텍스트 분석 (인간 언어 기술에 대한 합성 강의) (2009) 소개 :이 책은 언어 주석 및 텍스트 분석에 대한 기본 소개를 제공합니다. GATE 및 UIMA의 두 가지 주요 텍스트 분석 아키텍처를 설명하고 비교하며,이를 구성하고 사용자 정의하는 방법을 보여주는 실습과 함께 설명합니다..

결론

GATE는 대중적이고 성숙한 솔루션입니다. 인기로 인해 대규모의 활발한 커뮤니티가 뒷받침하므로 앞으로 몇 년 동안 지속될 것입니다..

그러나 GATE가 모든 사람을위한 것은 아닙니다. 그 사용은 상대적으로 작은 틈새로 제한됩니다. 한편, 상기 틈새 시장에서의 사용은 널리 퍼져있다. GATE의 유연성은 큰 제약에서 교육에 이르기까지 다양한 산업 및 조직에서 사용할 수 있습니다..

무엇보다도 필요한 것이 확실하지 않은 경우 GATE를 무료로 사용해 볼 수 있으며, 원하는 경우 LGPL을 고수하는 한 오픈 소스 소프트웨어와 같은 상업용 프로젝트에 배포 할 수 있습니다 표준.

추가 자료 및 자료

코딩 및 개발과 관련된 더 많은 가이드, 자습서 및 인포 그래픽이 있습니다.

  • Java : 소개, 학습 방법 및 리소스 : GATE를 사용하려는 경우 Java 프로그래밍 언어에 대한 소개를 확인하십시오..

  • 스칼라 프로그래밍 소개 : 새롭고 개선 된 자바 인 스칼라에 대해 배우십시오.

  • 프롤로그 자료 : 프롤로그는 자연 언어 처리를 위해 특별히 설계되었습니다..

챗봇과 사랑에 빠지지 않는 방법

자연어 처리에 관심이 있습니까? 그 역사, 챗봇과 사랑에 빠지는 것을 피하는 방법에 대한 모든 것을 배우십시오. 먼 길을 왔습니다.

챗봇과 사랑에 빠지지 않는 방법
챗봇과 사랑에 빠지지 않는 방법

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map