pdf파일 전문(Full-Text) 검색 방법
본문
안녕하세요
게시판에 등록된 pdf파일 전문 검색이 가능할까요??
방법이 있으면 수정할 부분과 코드 부탁 드립니다,
감사 합니다 ㅠㅠ
답변 3
방법이 없지는 않지만 쉬운 작업이 아닙니다. 제작의뢰로 의뢰 해 보는것이 좋을 듯 합니다
검색해 본 결과인데 참고해 보세요
https://coronasdk.tistory.com/582
PDF 추출하는 api 가 많이 있습니다.
추출 성능이 높아야 하는 경우라면, 업스테이지 도큐먼트 파서나, claude api 를 쓰는 방법이 있습니다.
(추출 성능이 높으면 가격이 비싸다고 생각하시면 됩니다.)
단순하게 pdf에서 텍스트만 추출한다면, python 이나 java 로 된 라이브러리를 통해 추출한것을 db 에 저장하는 방식이 적당할것 같네요.
데이타를 추출한뒤에 전문 검색을 할수 있겠죠.
답변을 작성하시기 전에 로그인 해주세요.