Jel zna neko kako da sa regexom parsira ugnjezdene divove. Ovakav je html:
<div class="content">
<div class="profile-info">
bla bla
</div>
<div class="post-content">
blabla
</div>
</div>
Ako probam ovakav .*?<div class="content">(.*?)</div>.*? regex, on ce uhvatiti sve do prvog zatvorenog div-a, sto nije zatvorenje tog diva, vec nekog unutrasnje, znaci omasi skroz.
Ovo bi trebalo da je nemoguce jer regularni jezici nisu ista kategorija kao html, ali me zanima kako biste ovo resili bez bs4 i vec gotovih html/xml parsera.
Dobio sam ovakav zadatak za razgovor za posao, nisam uspeo da resim jer traze samo regex da se koristi, ali me svejedno zanima resenje kako bi bilo