Trang chủ /

Tin Tức

Sản Phẩm Bán Chạy

Nâng cấp Google One chính chủ Giá Siêu Rẻ

259,000 VNĐ

Nâng cấp Duolingo Super

299,000 VNĐ

YouTube Premium Nâng cấp TK Chính Chủ

199,000 VNĐ

Nâng cấp tài khoản Gemini Advanced

99,000 VNĐ

Tài khoản Zoom Pro Chính Chủ Giá Rẻ

199,000 VNĐ

Nâng cấp tài khoản Capture One chính hãng

350,000 VNĐ

Nâng Cấp Tài Khoản Netflix Giá Rẻ

359,000 VNĐ

Nâng cấp tài khoản Quizizz Super chính chủ

799,000 VNĐ

Nâng cấp Office 365 Chính Hãng

399,000 VNĐ

Tài khoản CapCut Pro bản quyền chính hãng

399,000 VNĐ

Adobe Photoshop Bản Quyền Full App Giá Rẻ

899,000 VNĐ

Nâng cấp Coursera PLus chính chủ

399,000 VNĐ

Nâng cấp Canva Pro giá rẻ

199,000 VNĐ

Trọn Bộ Autodesk All App Giá Rẻ

1,499,000 VNĐ

Nâng Cấp Tài khoản Freepik Premium

599,900 VNĐ

Google One chính chủ Giá Siêu Hời

259,000 VNĐ

Key Windows 10/11 Pro bản quyền

599,000 VNĐ

Tài Khoản ChatGPT Plus (GPT-4)

199,000 VNĐ

Tính Năng Mới Của Gemini: Khoanh Tròn, Vẽ Nhanh – AI Xử Lý Mọi Thứ

24/10/2025 515

Gemini ra mắt “vũ khí” mới: chỉ cần khoanh tròn hay vẽ nguệch ngoạc, AI sẽ hiểu và xử lý ảnh ngay lập tức.

Nội dung

Tính Năng Mới Của Gemini: Khoanh Tròn, Vẽ Nhanh – AI Xử Lý Mọi Thứ

Một thông tin rò rỉ gần đây đã khiến cộng đồng công nghệ xôn xao: Google đang phát triển một tính năng hoàn toàn mới cho nền tảng trí tuệ nhân tạo Gemini, cho phép người dùng chỉ cần khoanh tròn hoặc vẽ nguệch ngoạc lên ảnh để yêu cầu AI phân tích, chỉnh sửa hoặc loại bỏ các chi tiết không mong muốn. Đây được xem là một bước tiến đột phá, kết hợp sức mạnh phân tích hình ảnh của Gemini với tính trực quan và tiện lợi của tính năng “Circle to Search”.

1. Tính năng mới đầy hứa hẹn vừa bị rò rỉ

Theo nguồn tin từ trang Android Authority, trong quá trình “mổ xẻ” phiên bản ứng dụng Google 16.42.61.sa.arm64, các nhà phát triển đã phát hiện ra một công cụ đánh dấu mới ẩn trong mã nguồn. Tính năng này cho phép người dùng vẽ trực tiếp lên hình ảnh sau khi tải chúng vào giao diện Gemini. Đây là dấu hiệu cho thấy Google đang chuẩn bị cho một cuộc cải tiến lớn về cách con người tương tác với AI thông qua hình ảnh.

Trước đây, người dùng có thể tải ảnh lên Gemini và đặt câu hỏi chung chung như “đây là món ăn gì?” hoặc “hãy mô tả bức ảnh này”. Tuy nhiên, hạn chế nằm ở chỗ AI chỉ có thể phân tích toàn bộ hình ảnh, chứ không thể hiểu được người dùng đang muốn nói đến phần nào cụ thể. Tính năng mới được rò rỉ sẽ thay đổi điều đó. Thay vì chỉ nhập văn bản, người dùng có thể “nói chuyện” với AI bằng hành động trực quan: khoanh tròn một vật thể, gạch chân một dòng chữ hoặc tô màu một khu vực muốn tập trung. Khi bức ảnh đã được đánh dấu, người dùng có thể gửi kèm yêu cầu như “hãy xóa phần này”, “hãy mô tả vật thể tôi vừa khoanh” hoặc “hãy tìm thông tin về món ăn trong khu vực này”.

Các ảnh chụp màn hình được phát hiện cho thấy Gemini có thể đang thử nghiệm một bộ công cụ vẽ nhỏ cho phép lựa chọn màu sắc và độ dày nét vẽ. Dù giao diện hiện tại vẫn còn thô sơ, nhưng kết quả thử nghiệm ban đầu khiến nhiều người bất ngờ. Android Authority cho biết họ đã thử yêu cầu Gemini “xóa phần được đánh dấu khỏi ảnh” và AI đã trả về kết quả “hoàn hảo một cách đáng ngạc nhiên”. Bức ảnh sau khi xử lý gần như không để lại dấu vết chỉnh sửa, chứng minh khả năng xử lý hình ảnh và tạo sinh nội dung của mô hình Gemini 2.5 Flash Image (Nano Banana) đã đạt đến mức rất tinh vi.

Nếu thông tin này được xác nhận, Gemini sẽ không chỉ là một công cụ hỏi đáp hoặc sáng tạo nội dung, mà còn trở thành một nền tảng chỉnh sửa hình ảnh mạnh mẽ. Người dùng có thể khoanh vùng một món ăn trong ảnh và yêu cầu công thức, đánh dấu một tòa nhà để hỏi thông tin lịch sử hoặc chỉ đơn giản là chọn vật thể thừa trong ảnh và yêu cầu AI xóa đi. Tất cả đều được thực hiện trực quan, nhanh chóng và dễ dàng, mà không cần kỹ năng chỉnh sửa ảnh chuyên sâu.

Dù Google chưa công bố chính thức, song việc mã nguồn chứa các đoạn code liên quan đến “drawing tools”, “highlight region” và “erase target” khiến giới chuyên môn tin rằng đây chỉ còn là vấn đề thời gian trước khi tính năng này xuất hiện trong bản cập nhật Gemini sắp tới.

2. Gemini sắp có thể khoanh vùng đối tượng để AI phân tích và xóa vật thể

Trong bản phân tích APK của Android Authority, công cụ đánh dấu hình ảnh xuất hiện dưới dạng một tính năng thử nghiệm chưa được kích hoạt. Khi người dùng tải ảnh lên Gemini, một giao diện vẽ sẽ xuất hiện cho phép họ khoanh tròn vùng ảnh mà họ muốn AI tập trung xử lý. Việc “khoanh vùng đối tượng” này được mô tả trong mã nguồn với cụm từ “highlighting part of an image allows you to direct Gemini’s attention to it for analysis” tạm dịch là “đánh dấu một phần ảnh cho phép bạn hướng sự chú ý của Gemini vào khu vực đó để phân tích”.

Điều này cho thấy Google đang hướng đến việc giúp AI hiểu rõ hơn ngữ cảnh hình ảnh dựa trên chỉ dẫn trực quan. Thay vì phải viết dài dòng kiểu “hãy xóa người đàn ông đứng ở góc trái bức ảnh”, người dùng chỉ cần vẽ một vòng tròn quanh người đó. AI sẽ lập tức hiểu vùng được chọn chính là đối tượng cần xử lý.

Mua Tài khoản Google AI Pro (Gemini Pro) Giá Rẻ

Các thử nghiệm ban đầu cho kết quả rất khả quan. Khi người thử nghiệm khoanh vùng một khu vực cụ thể trong ảnh và gửi lệnh “xóa phần được khoanh”, Gemini đã tái tạo phần nền phía sau một cách tự nhiên. Không chỉ loại bỏ vật thể chính xác, AI còn sử dụng các kỹ thuật tái tạo bối cảnh để khôi phục chi tiết nền, tạo cảm giác như chưa từng có chỉnh sửa. Đây là một bước tiến lớn nếu so với các công cụ “content-aware fill” hay “object removal” trong các phần mềm chỉnh sửa ảnh truyền thống, vốn thường để lại lỗi hoặc viền mờ.

Khả năng này được hỗ trợ bởi mô hình Gemini 2.5 Flash Image (Nano Banana): một biến thể tối ưu của mô hình Gemini chuyên về xử lý hình ảnh. Nano Banana được Google thiết kế nhằm mang đến tốc độ phản hồi nhanh và hiệu quả cao hơn trên các thiết bị di động. Nó có khả năng hiểu ngữ cảnh hình ảnh, nhận diện vật thể, đồng thời thực hiện các thao tác chỉnh sửa hoặc tái tạo hình ảnh với độ chính xác rất cao.

Nếu xét ở khía cạnh trải nghiệm người dùng, tính năng này giống như một phiên bản nâng cấp của các công cụ chỉnh sửa ảnh AI đang phổ biến, nhưng được tích hợp sâu vào Gemini. Bạn có thể tưởng tượng rằng chỉ cần một cú khoanh tròn và vài từ mô tả, bức ảnh của bạn sẽ được xử lý trong tích tắc. Điều này khiến ranh giới giữa thiết kế chuyên nghiệp và người dùng phổ thông trở nên mờ nhạt hơn bao giờ hết.

3. Tương lai tiện ích và ảnh hưởng đến người dùng thiết kế

Tính năng khoanh vùng ảnh của Gemini không chỉ là một công cụ vui chơi dành cho người dùng phổ thông, mà còn là bước ngoặt đối với những người làm sáng tạo nội dung, thiết kế đồ họa và truyền thông.

Với người làm nội dung, việc có thể tương tác trực tiếp với AI bằng hình ảnh sẽ mở ra một kỷ nguyên mới. Bạn không cần phải miêu tả rườm rà, không cần dùng các phần mềm chỉnh sửa ảnh phức tạp. Chỉ cần khoanh tròn vùng cần chỉnh, viết yêu cầu và để AI thực hiện phần còn lại. Đây là sự kết hợp hoàn hảo giữa công nghệ và trực giác sáng tạo, giúp người dùng tiết kiệm thời gian mà vẫn đạt được kết quả như mong muốn.

Hãy tưởng tượng bạn đang viết một bài blog du lịch và có bức ảnh chụp phong cảnh nhưng xuất hiện một người lạ trong khung hình. Trước đây, bạn sẽ phải mở Photoshop hoặc các công cụ chỉnh sửa chuyên dụng để loại bỏ chi tiết thừa. Giờ đây, chỉ cần mở Gemini, khoanh tròn người đó và viết “xóa người trong vùng khoanh”, vài giây sau, bức ảnh đã hoàn hảo.

Đối với designer, tính năng này có thể thay đổi hoàn toàn quy trình làm việc. Thay vì sử dụng nhiều phần mềm tách biệt để xử lý hình ảnh, họ có thể hoàn thiện một phần lớn công việc ngay trong Gemini. Từ việc xóa nền, thay đổi chi tiết, đến việc phân tích bố cục, tất cả đều có thể được thực hiện bằng cách kết hợp giữa văn bản và thao tác trực quan.

Đặc biệt, khả năng phân tích nội dung hình ảnh theo vùng cũng mang lại lợi ích lớn cho các nhà thiết kế UX/UI. Khi bạn muốn kiểm tra độ tương phản giữa các phần trong giao diện hoặc muốn AI đề xuất chỉnh sửa cụ thể cho một khu vực nhỏ, bạn chỉ cần khoanh vùng khu vực đó và yêu cầu Gemini đánh giá. AI sẽ phân tích riêng biệt vùng được chọn thay vì toàn bộ hình ảnh, giúp phản hồi chính xác và có giá trị thực tiễn hơn.

Không chỉ dừng ở lĩnh vực thiết kế, công cụ này còn hữu ích cho giáo dục và nghiên cứu. Một giảng viên có thể khoanh vùng cấu trúc trong ảnh chụp kính hiển vi để hỏi Gemini về đặc điểm sinh học của nó. Một sinh viên kiến trúc có thể đánh dấu phần chi tiết của tòa nhà trong ảnh và yêu cầu AI phân tích phong cách thiết kế. Một phóng viên có thể khoanh tròn một chi tiết nhỏ trong ảnh hiện trường và yêu cầu Gemini nhận diện đối tượng hoặc biểu tượng xuất hiện.

4. Những gì rõ và những gì còn là dự đoán

Từ các thông tin đã được phân tích, có thể khẳng định rằng công cụ đánh dấu ảnh đã thực sự xuất hiện trong mã nguồn ứng dụng Google. Điều đó đồng nghĩa với việc nhóm phát triển đang ở giai đoạn thử nghiệm nội bộ và tính năng này hoàn toàn có thể được kích hoạt trong tương lai gần.

Một số yếu tố như giao diện, bộ công cụ màu, cách thao tác vẽ và xác nhận vùng khoanh đã được phát hiện. Tuy nhiên, thời điểm phát hành chính thức, mức độ khả dụng trên các thiết bị khác nhau và phạm vi chức năng vẫn chưa được công bố. Google thường có thói quen thử nghiệm giới hạn trên các thiết bị Pixel trước khi mở rộng cho toàn bộ hệ sinh thái Android.

Ngoài ra, vẫn chưa rõ liệu tính năng này có được tích hợp trực tiếp vào ứng dụng Gemini độc lập hay xuất hiện dưới dạng phần mở rộng trong “Circle to Search”. Cũng có khả năng Google sẽ hợp nhất cả hai để người dùng có thể khoanh vùng bất kỳ ảnh nào trên màn hình điện thoại, rồi gửi yêu cầu phân tích trực tiếp mà không cần chuyển đổi ứng dụng.

Mặc dù có nhiều dự đoán, giới chuyên môn đều đồng thuận rằng đây là bước đi hợp lý trong chiến lược của Google. Khi các mô hình AI đa phương thức ngày càng phát triển, việc giúp người dùng tương tác với AI bằng hành động trực quan sẽ trở thành xu hướng tất yếu. Và Google, với nền tảng mạnh về nhận diện hình ảnh, đang sở hữu đầy đủ điều kiện để dẫn đầu xu thế này.

5. Thiết kế trải nghiệm người dùng và nội dung hướng dẫn

Nếu xét dưới góc độ thiết kế sản phẩm, việc bổ sung khả năng “vẽ khoanh vùng” trong Gemini là một bài toán UX phức tạp nhưng đầy thú vị. Người dùng có thể đến từ nhiều nhóm khác nhau từ người sáng tạo chuyên nghiệp đến người dùng phổ thông nên giao diện phải vừa trực quan, vừa mạnh mẽ.

Việc vẽ và khoanh vùng trên ảnh tưởng đơn giản nhưng đòi hỏi thiết kế tinh tế để tránh rối mắt hoặc nhầm lẫn. Người dùng cần cảm nhận được sự phản hồi tức thì khi vẽ, đường khoanh cần mềm mại, tự nhiên, không bị lag. Khi AI nhận lệnh, giao diện nên hiển thị hiệu ứng để cho thấy vùng khoanh đã được xác định chính xác.

Từ khía cạnh nội dung, Google cũng có thể cần phát triển một hệ thống hướng dẫn trực quan để người dùng hiểu cách sử dụng. Các đoạn mô tả ngắn, hình minh họa hoặc video demo sẽ giúp tính năng này nhanh chóng được tiếp nhận. Với những người viết nội dung sáng tạo, đây là cơ hội tuyệt vời để xây dựng các hướng dẫn, bài viết và video chia sẻ mẹo sử dụng Gemini trong thiết kế, chỉnh ảnh, học tập hay truyền thông.

Trong tương lai gần, có thể sẽ xuất hiện hàng loạt khóa học, bài viết hoặc tài liệu chuyên sâu về “cách sử dụng công cụ vẽ trong Gemini”, “ứng dụng khoanh vùng AI trong sáng tạo hình ảnh” hoặc “kết hợp Gemini với workflow thiết kế hiện đại”. Khi đó, người sáng tạo nội dung sớm nắm bắt được công cụ này sẽ có lợi thế lớn, bởi họ có thể hướng dẫn cộng đồng và phát triển nội dung hữu ích gắn liền với công nghệ mới.

6. Kết luận

Sự xuất hiện của tính năng vẽ nguệch ngoạc trong Google Gemini, dù mới chỉ dừng ở mức rò rỉ, vẫn được đánh giá là một trong những bước tiến quan trọng nhất trong tương lai gần của công nghệ AI do Google phát triển. Nó mở ra khả năng tương tác hoàn toàn mới, nơi con người không còn bị giới hạn bởi câu chữ hay lệnh văn bản mà có thể giao tiếp với trí tuệ nhân tạo bằng những thao tác trực quan tự nhiên nhất.

Gemini đang dần tiến gần hơn đến mục tiêu trở thành hệ thống AI toàn năng có thể hiểu ngôn ngữ, hình ảnh, âm thanh và hành động của con người. Và nếu tính năng này được triển khai đúng như dự đoán, nó sẽ không chỉ thay đổi cách chúng ta tương tác với AI, mà còn định hình lại cách chúng ta sáng tạo, học hỏi và giao tiếp với thế giới số.

Mua Tài khoản Google AI Pro (Gemini Pro) Giá Rẻ

Công Ty TNHH Phần Mềm SADESIGN

Mã số thuế: 0110083217

Liên Hệ Zalo

Liên Hệ Hotline

Liên Hệ Facebook