Encode-Decode

  • 홈
  • 태그
  • 방명록

algorithm 1

Porter Stemmer 구현 - VC_count 알고리즘

6/30 언어공학 수업 Martin F.Porter가 1980년 착안한 stemming 알고리즘 python으로 구현해보기 Stemming = 영어단어에서 접사(affix)를 제거하고 핵심적인 의미를 가지는 어간(stem)을 추출하는 과정 Porter의 algorithm for suffix stripping 에 나오는 단어의 consonant와 vowel의 연속개수를 counting 하고 단계적으로 규칙을 적용하여 stem을 추출하는 아이디어를 코드로 구현해보자 def VC_count (stem): vowel = ['a','e','i','o','u'] consonant = ['b','c','d','f','g','h','j','k','l','m','n','p','q', 'r','s','t','v','w',..

카테고리 없음 2022.07.02
이전
1
다음
더보기
프로필사진

Encode-Decode

따뜻한 기계

  • 분류 전체보기 (31)

Tag

nlp, 크기가 작은 부분 문자열, Table Representation Learning, Table-to-Text-Generation, 2022 빅콘테스트, 챔피언부문, 수상후기, 코딩테스트, 달리기경주, 신고당한사람, FullyConnectedLayer, TaBERT, 프로그래머스, 알고리즘, 구현, 이코테, Datascience Pipeline, 추억점수, 데이터분석리그, LLM as AGENT,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • Git

티스토리툴바