Aiware AI Newsletter #6

CursorAI | Google Gemini | Midjourney v7 | Nowe Narzędzia AI

Piotr Macai
September 01, 2024

Cursor AI to największa rewolucja od wydania ChataGPT

Ogłoszenie/plotki o funkcjach Midjourney v7

Ogromne aktualizacje od Google

Ostatnie narzędzia AI

Cursor AI to rewolucja w programowaniu

Cursor to edytor kodu zasilany AI, który wykorzystuje sztuczną inteligencję do wspierania programistów w pisaniu i zarządzaniu kodem w sposób bardziej efektywny. Umożliwia użytkownikom opisywanie ich potrzeb programistycznych w naturalnym języku, co AI interpretuje, aby generować odpowiednie fragmenty kodu, co sprawia, że programowanie staje się bardziej intuicyjne i mniej zależne od składni.

Kluczowe funkcje Cursor

Komendy w naturalnym języku

Cursor posuwa koncepcję generowania kodu o krok dalej, umożliwiając programistom pisanie i modyfikowanie kodu za pomocą instrukcji w naturalnym języku. Wydając polecenie „Cmd-K”, możesz wydać proste polecenia w języku angielskim do Cursor, takie jak „Zaktualizuj style przycisków, aby pasowały do nowego brandingu” lub „Dodaj nową metodę do klasy User, która zwraca pełne imię użytkownika”. Silnik AI Cursor analizuje twoje polecenie, rozumie intencję i generuje lub modyfikuje odpowiedni kod. Ta funkcja pozwala programistom skupić się na logice na wysokim poziomie i pożądanych rezultatach, podczas gdy Cursor zajmuje się żmudnym i podatnym na błędy zadaniem przekształcania tych pomysłów w działający kod.

Autouzupełnianie i przewidywanie kodu

Cursor zawiera potężną funkcję autouzupełniania, która jest zawsze aktywna, przewidując następne edycje na podstawie ostatnich zmian programisty. Ta funkcjonalność obejmuje edycje wieloliniowe, co pozwala IDE sugerować wiele modyfikacji jednocześnie, co usprawnia proces programowania. Funkcję autouzupełniania wzmacnia zdolność Cursor do śledzenia ostatnich zmian, co umożliwia skuteczne przewidywanie intencji programisty.

Inteligentne poprawki i nawigacja

IDE oferuje inteligentne możliwości poprawy, automatycznie korygując niedbałe błędy typograficzne. Dodatkowo, Cursor przewiduje następne położenie kursora, co ułatwia płynne poruszanie się po bazie kodu. Ta funkcjonalność przewidywania jest kluczowa dla utrzymania efektywności pracy, szczególnie w większych projektach.

Zintegrowana funkcjonalność czatu

Cursor ma zintegrowany czat, który pozwala programistom na interakcję z AI, mającym wgląd w aktualną bazę kodu. Użytkownicy mogą zadawać pytania dotyczące potencjalnych błędów lub prosić o wyjaśnienia dotyczące konkretnych bloków kodu. Interfejs czatu obsługuje kontekstowe polecenia, takie jak dodawanie konkretnych bloków kodu do rozmowy lub odwoływanie się do dokumentacji, co zwiększa trafność odpowiedzi AI.

Interakcje z bazą kodu

Programiści mogą korzystać z poleceń takich jak @Codebase lub Ctrl+Enter, aby zapytać swoją bazę kodu, co pozwala Cursorowi wyszukiwać i pobierać odpowiednie fragmenty kodu. Ta funkcja jest uzupełniona możliwością odniesienia się do plików kodu i symboli za pomocą symbolu @, co ułatwia nawigację i efektywne wykorzystanie istniejącego kodu.

Integracja terminala

IDE zawiera także funkcjonalność terminala, pozwalając programistom pisać polecenia terminalowe w prostym języku angielskim. Cursor tłumaczy te polecenia na odpowiednią składnię terminala, co dodatkowo upraszcza proces rozwoju.

Composer Cursor

Cursor Composer to eksperymentalne narzędzie do edycji wielu plików, zaprojektowane w celu usprawnienia procesu kodowania dla inżynierów poprzez umożliwienie jednoczesnych modyfikacji w kilku plikach w bazie kodu. Ta innowacyjna funkcja integruje zaawansowane modele AI, takie jak GPT-4, aby wspierać użytkowników w dokonywaniu inteligentnych zmian w kodzie na podstawie konkretnych poleceń.

Edycja wielu plików: Kompozytor Cursor umożliwia użytkownikom edytowanie wielu plików jednocześnie, usprawniając przepływ pracy w kodowaniu. Jest to szczególnie przydatne w zarządzaniu dużymi bazami kodu, gdzie zmiany często muszą być stosowane w różnych plikach.

Aktualizacje w czasie rzeczywistym: W miarę wprowadzania poleceń, Kompozytor zapewnia aktualizacje i informacje zwrotne w czasie rzeczywistym, co pozwala na natychmiastowe dostosowania i poprawki.

Jak korzystać z Cursor?

Po prostu otwórz folder z plikiem projektu lub otwórz pusty folder,

Użyj skrótów do wprowadzania instrukcji do tworzenia lub edytowania kodu:

✅ CTRL + Shift + I

Otwórz Kompozytor - możesz prawie wszystko, czego potrzebujesz z Kompozytorem Cursor

✅ CTRL + K

Generuj lub edytuj w naturalnym języku -> zaakceptuj lub edytuj

✅ CTRL + Shift + L

Dodaj kod do czatu i zadaj pytania na jego temat

✅ CTRL + Enter

Czat z całą bazą kodu

Duże aktualizacje od Google Gemini

Google Gems, Google Studio to nowe feature od Google.

Google Gems

Gems to dostosowane wersje Gemini, które działają jako eksperci w danej dziedzinie.

Wygląda na to, że działają bardzo podobnie do OpenAI GPT lub Huggingface Assistants, ale z połączeniem z Twoimi aplikacjami Google.

Zostały uruchomione wstępnie zbudowane Gems dla różnych scenariuszy.

Google AI Studio

Google AI Studio to oparte na chmurze środowisko, które zapewnia zestaw narzędzi i zasobów do budowania, trenowania i wdrażania modeli uczenia maszynowego, co czyni je dostępnym dla użytkowników o wszystkich poziomach umiejętności.

Oferując przyjazny interfejs, wstępnie zbudowane modele i bezproblemową integrację z usługami Google Cloud, AI Studio umożliwia użytkownikom skupienie się na innowacjach, a nie na zarządzaniu infrastrukturą.

Spróbuj sam: https://aistudio.google.com/

Wszystkie szczegóły dotyczące najnowszych aktualizacji Google AI znajdziesz na ich blogu: https://blog.google/products/gemini/google-gemini-update-august-2024/

Zapowiedzi Midjourney v7 z video

Źródło: @nickfloats na X
Kilka spostrzeżeń z rozmowy @nickfloats z CEO Midjourney na temat nadchodzącego modelu wideo Midjourneyv7

przetwarzanie w czasie rzeczywistym jest kluczowe dla tworzenia efektywnych interfejsów wideo. Jeśli renderowanie jest zbyt wolne, hamuje to szybką iterację, co jest kluczowe dla kreatywnego przepływu

zamiast dostarczać jeden wysokiej rozdzielczości wideo, lepiej byłoby oferować wiele wideo o niższej rozdzielczości, pozwalając użytkownikom wybrać najlepszą opcję, a następnie mieć skalera lub interpolatora klatek do poprawy jakości wideo. Takie podejście mogłoby zapewnić większą elastyczność i kontrolę dla użytkowników

3D bardziej polega na poruszaniu kamerą po scenie, podczas gdy wideo koncentruje się na ruchu elementów w obrębie sceny. Te modele będą na początku oddzielne, a ostatecznie się połączą

wciąż ustalają, jak zrównoważyć szybkość, koszt i jakość

potrzeba dalszych eksperymentów. Rzeczy takie jak zmniejszenie rozdzielczości lub liczby klatek mogą wprowadzić nowe problemy, takie jak sprawienie, że model stanie się „dziwaczny”. Planują trenować wiele wersji modelu, aby znaleźć optymalne zrównoważenie

Dla niego szybkość wydaje się ograniczeniem. Mają kilka pomysłów, aby to przyspieszyć, ale prawdopodobnie stanie się to droższe, jeśli przyspieszą

Myśli, że będzie flagowy produkt, który będzie droższy, ale szybki i dobry, a potem stanie się tańszy z czasem

„Oczywiście wiem, że jeśli zrobimy coś droższego, to nie tak wiele osób będzie mogło z tego skorzystać, więc zdecydowanie jest w tym pewien konflikt.

Najnowsze narzędzia AI

Langchain: To framework stworzony do budowy aplikacji zasilanych przez LLM. Pozwala programistom tworzyć złożone przepływy pracy, które integrują różne źródła danych i API, umożliwiając płynne interakcje między różnymi komponentami aplikacji. Modułowy design Langchain wspiera szybkie prototypowanie i wdrażanie rozwiązań opartych na AI.
Google Vertex AI: To kompleksowa platforma, która zapewnia narzędzia do budowania, wdrażania i zarządzania modelami uczenia maszynowego. Vertex AI upraszcza proces trenowania modeli dzięki przyjaznemu interfejsowi i oferuje solidne wsparcie dla LLM. Programiści mogą korzystać z jego możliwości do tworzenia zaawansowanych aplikacji AI, które mogą analizować dane i generować spostrzeżenia w czasie rzeczywistym.
Hugging Face: Znany z obszernej bazy pretrenowanych modeli, Hugging Face jest centrum dla praktyków AI. Oferuje narzędzia do dostosowywania LLM do konkretnych zadań, co ułatwia personalizację modeli do określonych aplikacji. Platforma wspiera również współpracę, pozwalając użytkownikom dzielić się i poprawiać prace innych.
Flair AI: To innowacyjne narzędzie zasilane AI, które upraszcza proces tworzenia profesjonalnych sesji zdjęciowych produktów. Dzięki zaawansowanej technologii AI, Flair AI umożliwia użytkownikom generowanie oszałamiających zdjęć produktów przy minimalnym wysiłku.
Segmind: To platforma bezserwerowa, która upraszcza proces budowy i wdrażania aplikacji generatywnych AI. Oferując zestaw API i przepływów pracy, Segmind umożliwia programistom szybkie tworzenie i skalowanie rozwiązań zasilanych AI bez potrzeby skomplikowanego zarządzania infrastrukturą.
Napkin AI: To unikalne narzędzie, które przekształca pomysły oparte na tekście w oszałamiające wizualizacje, w tym diagramy graficzne i ilustracje. Dzięki zaawansowanym możliwościom przetwarzania języka naturalnego i generacji obrazów, Napkin AI pozwala użytkownikom szybko i łatwo tworzyć wizualizacje, które skutecznie komunikują ich koncepcje.