python 질문드립니다.

매출이 오르면 내리는 수수료! 지금 수수료센터에서 전자결제(PG)수수료 비교견적 신청해 보세요!
python 질문드립니다.

QA

python 질문드립니다.

본문

안녕하세요.

물어볼데가 없어서 여기에 질문드립니다.

다른 txt는 다 가져올수 있는데 data-index= 값을 어떻게 가져와야 되는지 알수가 없네요

감사합니다.

 

html 소스

<ul class="flex flex-wrap">

    <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="0">

           <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b58.jpg">

    </li>

     <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="1">

              <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b59.jpg">

      </li>

</ul>

 

python 소스

for c in soup.select('li[class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]"]'):

     episode_image                 = c.select_one('img')['src']

     episode_no                      = c.select_one('data-index').text

이 질문에 댓글 쓰기 :

답변 2

한번 참고해 보시겠어요.

 

from bs4 import BeautifulSoup

html_doc = '''
<ul class="flex flex-wrap">
    <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="0">
           <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b58.jpg">
    </li>
    <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="1">
              <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b59.jpg">
      </li>
</ul>
'''

soup = BeautifulSoup(html_doc, 'html.parser')

for c in soup.select('li[data-index]'):
    episode_image = c.select_one('img')['src']
    episode_no = c['data-index']
    print(episode_image, episode_no)
 

 

한번 참고해 보시겠어요.

 

from bs4 import BeautifulSoup

html_doc = '''
<ul class="flex flex-wrap">
    <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="0">
           <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b58.jpg">
    </li>
    <li class="w-full Episode_episodeItem__Hjwb9 relative mb-1 !w-[calc((100%-2px)/3)] lg:!w-[calc((100%-4px)/5)]" data-index="1">
              <img src="https://aaa/33583d6f-90ff-4708-a28c-57d299db7b59.jpg">
      </li>
</ul>
'''

soup = BeautifulSoup(html_doc, 'html.parser')

for c in soup.select('li[data-index]'):
    episode_image = c.select_one('img')['src']
    episode_no = c['data-index']
    print(episode_image, episode_no)
 

 

답변을 작성하시기 전에 로그인 해주세요.
전체 35
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT