Evo naso sam malo vremena pa cu odgovoriti pre nove godine. Cisto da Jablan ima sta da cita za docek ;)
Citat:
Ivan Dimkovic: Nisi ti citao comp.compression izgleda - tvoja teorija je odavno obradjena ;)
Citao sam comp.compression I zaista nasao sam neke SLICNE primere ali ne i ISTI.
Citat: Yet another popular idea is to split the input bit stream into a sequence of large numbers, and factorize those numbers. Unfortunately, the number of bits required to encode the factors and their exponents is on average not smaller then the number of bits of the original bit stream, so this scheme too cannot compress all data.
Za jedno oko konj corav. Eto kako ponekad finese odlucuju pobednika. I da ih sad covek lepo pita zasto ste za ime boga delili ulazni niz bita na sekvencu velikih brojeva verovatno ne bi imali sta da kazu. A da su samo malo apstrahovali ideju kao sto sam ja to ucinio dobili bi pravi rezultat. Posledica njihove deobe je sledeca: kako ni do jednog broja nije lakse ili teze doci uz pomoc koeficijenata (faktora) za vecu kolicinu brojeva bili su im potrebni visestruki setovi koeficijenata plus informacije o deobi tj ponovnom sastavljanju sekvence brojeva u pocetni niz - I kvota je premasena. Tolika kolicina informacija zauzima vise mesta nego pocetni niz. A sta se desava u mom modelu: Ceo fajl se tretira kao samo jedan broj. Za samo jedan broj potreban je samo jedan set koeficijenata da ga opise I nema pamcenja dodatnih informacija o deobi tj. sastavljanju sekvence brojeva. Za razliku od njihovog primera koji je kompresovao samo neke podatke program uradjen po mom modelu bi za dovoljno velike fajlove kompresovao sve podatke.
Citat:
Ivan Dimkovic:
Dakle, po 100-ti put - tvoj metod generalno ne radi, moze da upali za par namestenih slucajeva, ali u proseku ce informacija za skladistenje koeficijenata (faktora) biti veca od samog originalnog broja, pod uslovom da skladistis originalni broj na optimalan nacin. Nema potrebe da pravis program za to, postoji matematicki dokaz da je to sto hoces nemoguce.
Po 1000-ti put to sto SLICAN primer dokazano ne radi nije dokaz da moj primer ne radi. Inace svaka cast na moci opazanja primeri su zaista slicni ali slicni su I zaprezna kola I porse u oba slucaja u pitanju je prevozno sredstvo ali tu svaka slicnost prestaje.
Citat:
Ivan Dimkovic:
Hajde ovako,
- Pretpostavimo da tvoj metod radi za svaki fajl, tj. dovoljno dugu sekvencu M pseudo-slucajnog sadrzaja - sto je ono sto ti tvrdis.
- Zatim, pretpostavimo da si ti sekvencu M kompresovao vec jednom tvojim metodom i dobio sekvencu N, koja je i dalje duza od tvoje minimalne duzine, i zadovoljava tvoj uslov za kompresiju da je "dovoljno dugacka"
- Sada ces sekvencu N opet pohraniti u tvoj metod, i, po tebi - dobiti sekvencu X, koja je kraca od sekvence N
- Ponavljamo ovo dovoljno veliki broj puta...
Sta dobijamo na kraju? Beskonacnu kompresiju?
Back to the drawing board.
E pa sad ovo vec nije fer sta mi radis. Na ovo pitanje sam vec odgovarao Srkiju 07.01.2006. Pitanje je bilo sto ne bih kompresovao gigabajte u megabajte, megabajte u kilobajte itd. Odgovor cu naravno ponoviti I malo prosiriti.
Upravo ona granica velicine fajla ispod koje zapisivanje koeficijentima jos nije doslo do izrazaja kao racionalan nacin I ispod koje dolazi do ekspanzije umesto do kompresije sprecava da se ovom modelu prisije etiketa da bi visestrukom primenom algoritma rezultujuci fajl tezio nuli sto bi ovaj model cinilo nemogucim. U odgovoru Srkiju sam izrazio sumnju da bi uopste bilo mesta za visestruku kompresiju tj. kompresiju u vise nivoa ali sada bih jos da potsetim na cinjenicu da bi ovakva vrsta kompresije davala sve bolje rezultate sa sve vecim fajlovima tj. iduci “unazad” tj. kompresujuci sve manje fajlove dobijali bi se sve slabiji rezultati tj. sve manji stepen kompresije sto bi zajedno sa pamcenjem podataka o nivoima kompresije u jednom trenutku dovelo do pitanja racionalnosti daljeg kompresovanja. Uopste uzev iako ste u par navrata pokusali da mi prikacite nekakvu magicnost I volsebnost ovakve ideje kompresije u pitanju je ipak jedan prilicno realan model sa mnogobrojnim manama I vrlinama kao sto je I red.
I ono beskonacna kompresija sam vec objasnio: odnosilo se na sve veci stepen iskoriscenja sa sve vecim fajlovima a ne na teznju ka beskonacno maloj vrednosti za sve manje fajlove. Back to the drawing board.
Citat:
srki: Jao brate, ma mogu i samo cvarci, za njih bi sada dao sta god da mi trazis!!!
Posalji adresu I dobijes cvarke prvom prilikom. Kako je sezona svinjokolja prosla drzi palceve da ih jos ima u lokalnim mesarama inace ces morati da cekas do sledece jeseni.
Citat:
srki: Drugim recima ti treba da nam das tacan format kompresovanog fajla.
Tacan format kompresovanog fajla bi bio (n,m) gde je n duzina fajla u bitima a m redni broj pojavljivanja fajla na brojacu iste duzine izrazeno putem koefiucijenata (faktora)
Citat:
srki: Gde zapisujes broj koeficijenata, koliko bitova to zauzima,
Nigde, to bi bila suvisna informacija. Znaci nimalo.
Citat:
srki: koliko bitova ti zauzimaju koeficijenti
Kolko god a ja opravdano smatram da ce to biti manje od ulaznog niza.
Citat:
srki: kako se to odredjuje
Kako se sta odredjuje? Daj boze da me pitas kako se odredjuju koeficijenti za odredjeni broj jer bi u tom slucaju ova rasprava krenula ka nekim tehnickim detaljima vezanim za samu implementaciju za sta je I bilo krajnje vreme.
Citat:
srki: Kako da ti pomognemo ako ni ti nisi tacno objasnio kako izgleda taj fajl. Objasni nam cemu ti sluzi svaki bit u tom fajlu.
E ako dosad nisam objasnio…
Citat:
masetrt: Program koji ti trazis ne bi nista dokazao. Mozda bi pokazao da si u nekim slucajevima u pravu a u nekim ne, ali dokazao ne bi nista jer ko ce da proba sve moguce kombinacije? (odgovor niko)
Citat:
To cemo utvrditi eksperimentalnim putem kad budemo imali program. Za sada mogu samo da lupim da je to negde izmedju 32 I 320 bita.
Opet pogresan pristup. Ne moze se nesto sto treba da bude egzaktno utvrdjivati eksperimentalnim putem, vec se mora matematicki dokazati.
Kad je neko u pravu ja to odmah priznajem. Obe primedbe su na mestu. Kako lose stojim sa matematikom meni bi jedan od mogucih dokaza bio da se program uradi pa ako kompresuje podatke I ideja je bila ispravna a ako ne kompresuje onda nije.
Citat:
masetrt: Kao sto ti je Ivan rekao prvo sve isplaniraj, dokazi(matematicki), pa kad ljudima ovde predocis dokaz tuci ce se ko ce da ti implemenntira algoritam.
Ma tucicete se vi ko ce da implementira algoritam I kad vam kazem da imam cetri sestre za udaju. Srkiju sam vec nasao tanku zicu “zal za rodnom grudom” naci cu I vama. Ipak kako jos nisam stigao do te dekadentne faze da nudim sestre na konkursu u zamenu za program ponuda je sledeca: 90% akcija firme koja ce se baviti prodajom komresora. Malo li je? Srecna srpska nova godina.
[Ovu poruku je menjao Gojko Vujovic dana 22.01.2006. u 13:08 GMT+1]
Nemoj da pricas?