Poglejmo, kako lahko izvedete inferenco s Phi-3-mini na napravah z Androidom. Phi-3-mini je nova serija modelov iz Microsofta, ki omogoča uporabo velikih jezikovnih modelov (LLM) na robnih napravah in IoT napravah.
Semantic Kernel je aplikacijski okvir, ki omogoča ustvarjanje aplikacij, združljivih z Azure OpenAI Service, OpenAI modeli in celo lokalnimi modeli. Če ste novi pri Semantic Kernel, priporočamo, da si ogledate Semantic Kernel Cookbook.
Lahko ga združite s Hugging Face Connectorjem v Semantic Kernel. Oglejte si ta primer kode.
Privzeto ustreza ID-ju modela na Hugging Face. Vendar se lahko povežete tudi z lokalno postavljenim strežnikom modela Phi-3-mini.
Veliko uporabnikov raje uporablja kvantizirane modele za lokalno izvajanje modelov. Ollama in LlamaEdge omogočata posameznim uporabnikom klic različnih kvantiziranih modelov:
Model lahko zaženete neposredno z ukazom ollama run Phi-3 ali pa ga konfigurirate brez povezave tako, da ustvarite Modelfile s potjo do vaše .gguf datoteke.
FROM {Add your gguf file path}
TEMPLATE \"\"\"<|user|> .Prompt<|end|> <|assistant|>\"\"\"
PARAMETER stop <|end|>
PARAMETER num_ctx 4096
Če želite hkrati uporabljati .gguf datoteke v oblaku in na robnih napravah, je LlamaEdge odlična izbira. Za začetek si lahko ogledate ta primer kode.
- Prenesite aplikacijo MLC Chat (brezplačno) za Android telefone.
- Prenesite APK datoteko (148 MB) in jo namestite na svojo napravo.
- Zaženite aplikacijo MLC Chat. Videli boste seznam AI modelov, vključno s Phi-3-mini.
Za povzetek, Phi-3-mini odpira zanimive možnosti za generativno AI na robnih napravah, zato lahko začnete raziskovati njegove zmogljivosti na Androidu.
Omejitev odgovornosti:
Ta dokument je bil preveden z uporabo storitve za avtomatski prevod AI Co-op Translator. Čeprav si prizadevamo za natančnost, vas opozarjamo, da lahko avtomatski prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku velja za avtoritativni vir. Za pomembne informacije priporočamo strokovni človeški prevod. Za morebitna nesporazume ali napačne interpretacije, ki izhajajo iz uporabe tega prevoda, ne odgovarjamo.