Mig: #619 2023-02-20 12:37:53
Nie, kochani, to jest ponad moje możliwości przedzierać się przez 20 wpisów o "Willi+" u PO albo zakazie mięsa xD
Znaczy się, jest to wykonalne ale po pierwsze wiele ataków wygląda tak że jest wiele osobnych szpil czerpiących z tej samej narracji i to aż się prosi o podsumowanie zbiorcze a nie klepanie każdego przypadku z osobna. Wreszcie, większość wpisów to jest achronologicznie poukładany burdel i jeśli faktycznie chcesz robić zbiorczo, łączyć wątki, to musisz angażować do tego tę część mózgu za korzystanie z której się powinno płacić. Ergo, strategia manualnej archiwizacji jest tutaj strategią przegraną. Nie dam rady zbiorczo robić wszystkich partii w godzinkę dziennie.
Podczas pracy nad tym doszedłem do kilku wniosków. Najlepiej by było wydzielić osobną bazę danych poświęconą polityce/stanowi państwa. Tam trzymać tabele poświęcone osobom, grupom, wydarzeniom i spinom politycznym. Wszystkie zebrane podmioty powinny być połączone siecią tagów i innych danych korelujących. Dane byłyby dostępne na stosowne kwerendy, które można by projektować w oparciu o konkretny spin, wydarzenie czy udział konkretnych postaci.
Wszystkie dane byłyby zbierane automatycznie; Wpisy na portalach społecznościowych byłyby archiwizowane, wszelkie filmy pobierane a z nich wydobywane transkrypcje i rozpoznawanie/zapisywanie dodawanych napisów. Manualnie by się tylko tagowało i to tylko z początku, bo z czasem na zbudowanym secie można wyszkolić SI wyszkolone pod rozpoznawanie kontekstu.
To byłby mocny sztos i niejeden dziennikarz by dał sobie jaja uciąć i by je zjadł jeszcze ze smakiem za dostęp do takiej bazy, dlatego myślę że byłaby to dobra inwestycja. Ale to kolejny plan do odłożenia na półkę, na pewno nie teraz, ale nie wykluczam że zacznę prace przed tegorocznymi wyborami.
Co do samej obecnej operacji; ograniczę się do raportowania najgłośniejszych napierdalanek, deklaracji programowych itd.