Giải thích cách hoạt động máy móc của google

Rate this post

Những phát hiện gần đây mà Google đang sử dụng máy học để giúp xử lý một số kết quả tìm kiếm của nó đang thu hút sự quan tâm và câu hỏi về lĩnh vực này trong trí tuệ nhân tạo. Chính xác là “học máy” và làm thế nào để máy tự dạy mình? Dưới đây là một số nền được rút ra từ những người tham gia học máy tại Google chính nó.

Hôm qua, Google đã tổ chức sự kiện “Học máy 101” cho nhiều nhà báo công nghệ. Tôi là một trong những người tham dự. Mặc dù việc tính hóa đơn như một phần giới thiệu, những gì đã được bảo hiểm vẫn còn khá kỹ thuật và khó tiêu hóa cho tôi và một số người khác tham dự.

Ví dụ, khi một người thuyết trình cho bạn biết toán học với việc học máy là “dễ” và đề cập đến tính toán trong cùng một câu, chúng có một định nghĩa khác xa so với giáo dân, tôi sẽ nói!

Tuy nhiên, tôi đã hiểu rõ hơn về quy trình và các bộ phận liên quan đến máy móc – máy tính – học cách tự học cách nhận dạng vật thể, văn bản, lời nói và nhiều thứ khác. Đây là chuyến đi của tôi.

Các phần của máy Học

Các hệ thống học máy được tạo thành từ ba phần chính, đó là:

  • Model: hệ thống tạo ra các dự đoán hoặc xác định.
  • Tham số: Các tín hiệu hoặc các yếu tố được mô hình sử dụng để hình thành các quyết định.
  • Người học: hệ thống điều chỉnh các thông số – và ngược lại mô hình – bằng cách nhìn vào sự khác biệt trong dự đoán so với kết quả thực tế.

Bây giờ hãy để tôi dịch nó thành một vấn đề có thể xảy ra trên thế giới, dựa trên một điều mà Greg Corrado đã thảo luận ngày hôm qua , một nhà khoa học nghiên cứu cấp cao của Google và là đồng sáng lập của nhóm nghiên cứu sâu của công ty.

Hãy tưởng tượng bạn là một giáo viên. Bạn muốn xác định thời gian tối ưu mà học sinh nên học để đạt điểm tốt nhất trong kỳ thi. Bạn quay sang học máy để tìm giải pháp. Vâng, đây là quá mức cần thiết cho vấn đề cụ thể này. Nhưng đây là một minh hoạ rất đơn giản!

Làm mẫu

Mọi thứ bắt đầu với mô hình, một dự đoán rằng hệ thống máy học tập sẽ sử dụng. Mô hình ban đầu phải được cung cấp cho hệ thống bởi con người, ít nhất là với ví dụ cụ thể này. Trong trường hợp của chúng tôi, giáo viên sẽ nói với mô hình học máy để cho rằng học tập trong năm giờ sẽ dẫn đến một điểm kiểm tra hoàn hảo.

Mô hình chính nó phụ thuộc vào các tham số được sử dụng để tính toán. Trong ví dụ này, các tham số là số giờ học và điểm kiểm tra nhận được. Hãy tưởng tượng rằng các tham số là một cái gì đó như thế này:

  • 0 giờ = 50% điểm số
  • 1 giờ = 60% điểm số
  • 2 giờ = 70% điểm số
  • 3 giờ = 80% điểm số
    4 giờ = 90% điểm số
  • 5 giờ = 100% điểm

Hệ thống học máy sẽ thực sự sử dụng một phương trình toán học để diễn tả tất cả những điều trên, để tạo thành một đường xu hướng theo những gì mong đợi. Dưới đây là một ví dụ về cuộc thảo luận hôm qua:

Cung cấp đầu vào ban đầu

Bây giờ mô hình đã được thiết lập, thông tin thực tế được nhập vào. Ví dụ, giáo viên của chúng tôi có thể nhập bốn điểm kiểm tra từ các sinh viên khác nhau cùng với số giờ học.

Khi kết quả, điểm số không khớp với mô hình, trong ví dụ này. Một số nằm trên hoặc dưới đường xu hướng được dự đoán:

Bây giờ là lúc để học phần học máy!

Học tập Học tập

Tập điểm đó đã được nhập? Dữ liệu như thế này được trao cho một hệ thống học máy thường được gọi là “bộ đào tạo” hoặc “dữ liệu đào tạo” bởi vì nó được sử dụng bởi người học trong hệ thống học máy để tự đào tạo để tạo ra một mô hình tốt hơn.

Người học nhìn vào các điểm số và xem chúng xa xa như thế nào từ mô hình. Sau đó sử dụng nhiều toán hơn để điều chỉnh các giả định ban đầu. Ví dụ, danh sách từ phía trên có thể bị thay đổi như sau:

  • 0 giờ = 45% điểm
  • 1 giờ = 55% điểm số
  • 2 giờ = 65% điểm số
  • 3 giờ = 75% điểm số
  • 4 giờ = 85% điểm số
  • 5 giờ = 95% điểm số
  • 6 giờ = 100% điểm số

Dự đoán mới được làm lại để có thêm thời gian nghiên cứu để đạt được điểm số đó.

Đây chỉ là một ví dụ của quy trình, một quy trình hoàn thành. Điều quan trọng nhất là chỉ cần hiểu rằng người học thực hiện những điều chỉnh nhỏ cho các thông số, để tinh chỉnh mô hình. Tôi sẽ quay lại đây trong giây lát.

Rửa & Lặp lại

Bây giờ hệ thống được chạy lại, lần này với một bộ điểm mới. Những điểm số thực được so sánh với mô hình được sửa đổi bởi người học. Nếu thành công, điểm số sẽ được gần gũi hơn với dự đoán:

Cải thiện với người học

Tuy nhiên, những điều này sẽ không hoàn hảo. Vì vậy, người học sẽ một lần nữa điều chỉnh các thông số, để định hình lại mô hình. Một bộ dữ liệu thử nghiệm sẽ được nhập vào. Một sự so sánh sẽ xảy ra lần nữa, và người học sẽ lại điều chỉnh mô hình.

Chu kỳ sẽ lặp lại cho đến khi có một sự tự tin cao độ trong mô hình cuối cùng, nó thực sự dự đoán kết quả của điểm số dựa trên số giờ học.

Gradient Descent: Làm thế nào Máy học Giữ Từ Falling Down

Corrado của Google nhấn mạnh rằng phần lớn trong quá trình học máy là một khái niệm được gọi là “gradient descent” hoặc “gradient learning”. Nó có nghĩa là hệ thống sẽ thực hiện những điều chỉnh nhỏ hơn này cho đến khi nó được hoàn thiện.

Corrado so sánh nó để leo xuống một ngọn núi dốc. Bạn không muốn nhảy hoặc chạy, bởi vì đó là nguy hiểm. Bạn sẽ có nhiều khả năng làm cho một sai lầm và rơi. Thay vào đó, bạn hãy cẩn thận, từng bước một.

Hãy nhớ rằng “các toán học là dễ dàng” dòng tôi đã đề cập ở trên? Rõ ràng cho những người biết toán học và toán học, nó thực sự là dễ dàng, các phương trình liên quan.

Thay vào đó, thách thức thực sự là sức mạnh tính toán. Phải mất một thời gian dài để máy móc học hỏi, vượt qua tất cả các bước này. Nhưng khi các máy tính của chúng ta ngày càng trở nên to hơn, việc học máy dường như không thể trở thành hiện thực.

Bắt Fancy: Xác định Mèo

Ví dụ trên rất đơn giản. Như đã nói, nó là quá mức cần thiết cho một giáo viên sử dụng một hệ thống học máy để dự đoán điểm thi. Nhưng cùng một hệ thống cơ bản được sử dụng để làm những việc rất phức tạp, như xác định hình ảnh của mèo.

Máy tính không thể nhìn thấy như con người có thể. Vậy làm cách nào họ có thể xác định các đối tượng trong cách mà Google Photos chọn nhiều đối tượng trong ảnh của tôi:

Học máy để giải cứu! Cũng áp dụng nguyên tắc tương tự. Bạn xây dựng một mô hình của các yếu tố có thể có thể giúp xác định những gì một con mèo trong hình ảnh, màu sắc, hình dạng và như vậy. Sau đó, bạn cho ăn một bộ tập huấn những hình ảnh về mèo và xem mô hình hoạt động tốt như thế nào.

Người học sau đó sẽ điều chỉnh, và chu trình đào tạo vẫn tiếp tục. Nhưng mèo hoặc bất kỳ nhận dạng đối tượng nào cũng phức tạp. Có nhiều tham số được sử dụng như là một phần của việc hình thành mô hình và thậm chí bạn có các tham số trong các tham số được thiết kế để dịch các hình ảnh thành các mẫu mà hệ thống có thể kết hợp với các đối tượng.

Ví dụ: đây là cách hệ thống cuối cùng có thể xem một con mèo trên thảm:

Hình ảnh gần giống như bức tranh đã trở thành một giấc mơ sâu sắc, dựa trên mã DeepDream mà Google đã phát hành, lần lượt xuất phát từ thông tin mà nó chia sẻ về cách các hệ thống học máy của nó đã xây dựng mô hình để nhận ra các đối tượng.

Hình ảnh thực sự là một minh hoạ cho loại mô hình mà máy tính đang tìm kiếm, khi nó xác định một con mèo, chứ không phải là một phần của quá trình học thực tế. Nhưng nếu máy thực sự có thể nhìn thấy, đó là một gợi ý về cách nó sẽ thực sự làm như vậy.

Nhân tiện, một sự xoắn với sự thừa nhận hình ảnh từ ví dụ ban đầu của chúng tôi là bản thân mô hình ban đầu được tạo ra bằng máy móc chứ không phải là con người. Họ cố gắng tìm ra cho mình những gì một đối tượng đang làm nhóm ban đầu của màu sắc, hình dạng và các tính năng khác, sau đó sử dụng dữ liệu đào tạo để tinh chỉnh điều đó.

Xác định sự kiện

Để biết thêm một chút về sự phức tạp của tất cả những điều này, hãy xem xét nếu bạn muốn xác định không chỉ các đối tượng mà các sự kiện. Google giải thích rằng bạn phải giúp thêm vào một số quy tắc thông thường, một số hướng dẫn của con người cho phép quá trình học máy để hiểu các đối tượng khác nhau có thể thêm vào một sự kiện như thế nào.

Ví dụ, hãy xem xét điều này:

Như minh họa, một hệ thống học máy nhìn thấy một con người nhỏ bé, một cái giỏ và một quả trứng. Nhưng một con người nhìn thấy tất cả những điều này và nhận ra đây là một cuộc săn trứng Easter.

Điều gì về RankBrain?

Làm thế nào để tất cả các máy học tập áp dụng cho RankBrain? Google đã không nhận được những chi tiết cụ thể của nó, trong thực tế, nó thậm chí không được đề cập trong các cuộc thảo luận chính thức và ít hơn đã được tiết lộ trong các cuộc đàm phán trong thời gian nghỉ hơn đã được phát hành.

Tại sao? Về cơ bản, cạnh tranh. Google chia sẻ rất nhiều về cách thức mà máy học tập. Nó thậm chí chia sẻ rất nhiều chi tiết cụ thể về một số lĩnh vực. Nhưng nó vẫn giữ được sự tĩnh lặng của chính xác những gì đang xảy ra với việc học máy trong tìm kiếm, để tránh cho những điều mà nó tin là khá quan trọng và độc đáo.

Trả lời

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *