neděle 8. října 2023

Kdy se z AI stal buzzword?

Wikipedia označuje AI jako buzzword poprvé v anonymním příspěvku do článku "Buzzword" z 16.3.2020 - viz srovnání verzí:

https://en.wikipedia.org/w/index.php?title=Buzzword&diff=prev&oldid=945784721

Přičemž: 

  • Bing Code Search plugin pro Visual Studio 2013 coby Microsoft Research project byl uvolněn v únoru 2014. Tento plugin poskytuje kvalitní odpovědi na dotazy formulované v přirozeném jazyce a využívá data z několika zdrojů, vč. MSDN a StackOverflow.
  • GitHub Copilot byl spuštěn jako plugin v JetBrains marketplace 29.10.2021
  • DALL·E byl spuštěn v lednu 2021 a DALL·E 2  6. dubna 2022. Midjourney 12. července 2022.
  • ChatGPT bylo spuštěno 30.11.2022,  


pondělí 2. října 2023

Samsung debloater

  1.  stáhnout a nainstalovat adb - je v balíčku SDK Platform Tools 
  2. V seznamu https://gist.github.com/gsurrel/40cc506ac7e31134a87be4ba01a71103 vybrat balíčky, které nechci, např. Word, Excel, Powerpoint atd. 
  3. Nebo instalit a spustit GUI program Universal Android Debloater - https://github.com/0x192/universal-android-debloater 


neděle 30. července 2023

Jak zpracovat hromadu fotek nebo skenů knížek do prohledávatelného PDF

 Pro hromadné ořezání stránek PDF je super nástroj Briss:

https://sourceforge.net/projects/briss/

V OpenJDK 1.8 nějak nechtěl fungovat, ale v JDK17 to jede pěkně. Umí nařezat i vícesloupcové sazby, díky čemuž lze fotit i 2 stránky najednou. 

Ořezání v PDF je ale pouze "Crop", kde PDF obsahuje pořád originální obrázek bez ořezu. Pro OCR je potřeba obrázky z PDF dostat včetně správného ořezu, pro což jsem použil "Print to PNG" přes "PDF Creator".

V PNG jsem pak odstranil pozadí pomocí ImageMagick-u a pomocí OCR Tesseract jsem je převedl zpět do prohledávatelného PDF. Potřebné balíčky pro Windows MSYS2:

pacman -S mingw-w64-x86_64-imagemagick

pacman -S mingw-w64-x86_64-tesseract-ocr
pacman -S mingw-w64-x86_64-tesseract-data
(je potřeba vybrat balíček "ces", v případě potřeby jiných jazyků spustit vícekrát)


#!/bin/bash
dir="ocr"
for file in "$dir"/*.jpg; do
  /mingw64/bin/convert.exe $file -fuzz 35% -opaque White -rotate 90 -quality 60 $file.jpg
  /mingw64/bin/tesseract.exe $file $file -l ces PDF
echo "Done: "$file
done

 

pondělí 17. července 2023

Ubuntu kernel update

Nefunkční touchpad v Kubuntu 20.04 na notebooku Lenovo ThinkBook 14-IIL: 

Nejdřív jsem zkusil skript ubuntu-mainline-kernel.sh , který umožňuje nainstalovat jakýkoli kernel až po současné verze, s čímž může mít dnes již staré Ubuntu 20.04 problém.  

Tak jsem zkusil prostý upgrade kernelu na nejnovější LTS verzi pro 20.04, ovšem s HWE (HW enablement) drivery, takto:

apt-get install --install-recommends linux-generic-hwe-20.04

A hurá, jede to.