그누보드 QA - pdf파일 전문(Full-Text) 검색 방법

pdf파일 전문(Full-Text) 검색 방법

AI컴퓨터닷 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색

자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색

2025.01.14 08:57:38 조회 393 (1.♡.♡.237)

본문

안녕하세요

게시판에 등록된 pdf파일 전문 검색이 가능할까요??

방법이 있으면 수정할 부분과 코드 부탁 드립니다,

감사 합니다 ㅠㅠ

#그누보드5

답변 4

유찬아빠 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

2025-01-14 09:38:14 114.♡.♡.53

방법이 없지는 않지만 쉬운 작업이 아닙니다. 제작의뢰로 의뢰 해 보는것이 좋을 듯 합니다
검색해 본 결과인데 참고해 보세요

https://coronasdk.tistory.com/582

솔그루 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

2025-01-14 13:48:48 121.♡.♡.44

PDF 추출하는 api 가 많이 있습니다.

추출 성능이 높아야 하는 경우라면, 업스테이지 도큐먼트 파서나, claude api 를 쓰는 방법이 있습니다.

(추출 성능이 높으면 가격이 비싸다고 생각하시면 됩니다.)

단순하게 pdf에서 텍스트만 추출한다면, python 이나 java 로 된 라이브러리를 통해 추출한것을 db 에 저장하는 방식이 적당할것 같네요.

데이타를 추출한뒤에 전문 검색을 할수 있겠죠.

nabiwa 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

2025-01-14 15:21:29 115.♡.♡.205

추가 피해자 방지 https://sir.kr/conflictconsultation/245

포이치 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

2025-01-15 10:14:24 211.♡.♡.169

기본 로직만 설명 드리자면 여러 콤포넌트가 있겠지만

smalot/pdfparser 를 예를 들어...

컴포저로 해당 콤포넌트 설치하시고.

composer require smalot/pdfparser


<?php
require 'vendor/autoload.php';
use Smalot\PdfParser\Parser;
// PDF 파일 경로
$pdfFile = 'example.pdf'; //첨부파일 경로를 대입.
// PDF 파서 생성
$parser = new Parser();
$pdf = $parser->parseFile($pdfFile);
// PDF 내용 추출
$text = $pdf->getText();
// 검색할 텍스트
$searchText = '특정 텍스트'; //검색어
// 검색 수행
if (strpos($text, $searchText) !== false) {
    echo "텍스트가 발견되었습니다!";
} else {
    echo "텍스트를 찾을 수 없습니다.";
}
?>

요런식으로 간단히 설명 드립니다.

pdf 텍스트가 에디터에서 긁히는 방식이면 사용가능 하고 이미지 형식이면

Tesseract 를 통해 ocr 인식하셔야 합니다.

답변을 작성하시기 전에 로그인 해주세요.

전체 0

로그인

pdf파일 전문(Full-Text) 검색 방법

QA

pdf파일 전문(Full-Text) 검색 방법

본문

이 질문에 댓글 쓰기 :

답변 4

유찬아빠 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

솔그루 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

nabiwa 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

포이치 홈페이지 자기소개 전체게시물 회원게시물 회원 질문검색 회원 답변검색 회원 댓글검색 님의 답변

회원로그인