Как дешёвая рабочая сила питает амбиции Китая в области ИИ

Это перевод статьи Ли Юаня «How Cheap Labor Drives China’s A. I. Ambitions», опубликованной 25 ноября 2018 года в New York Times.

Рабочие в штаб-квартире компании Ruijin Technology в Цзясиане в центральной провинции Хэнань Китая. Они идентифицируют объекты на изображениях, чтобы помочь Искусственному Интеллекту понять мир.
Рабочие в штаб-квартире компании Ruijin Technology в Цзясиане в центральной провинции Хэнань Китая. Они идентифицируют объекты на изображениях, чтобы помочь Искусственному Интеллекту понять мир.

Некоторые из наиболее важных работ по достижению технологических целей Китая проводятся на бывшем цементном заводе в центре центральной части страны, вдали от растущих Кремниевых долин Пекина и Шэньчжэня. Бетономешалка на холостом ходу всё ещё стоит посреди двора. Коробки меламиновой посуды хранятся на складе по соседству.

Внутри Хоу Сяменг управляет компанией, которая помогает Искусственному Интеллекту понять мир. Два десятка молодых людей просматривают фотографии и видеоролики, обозначая почти всё, что видят. Это машина. Это светофор. Это хлеб, это молоко, это шоколад. Это то, что похоже на то, когда идёт человек.

«Раньше я думала, что машины — гении», — говорит 24-летняя Хоу. — «Теперь я знаю, что мы являемся причиной их гениальности».

В Китае, долгое время бывшем фабрикой мира, новое поколение низкооплачиваемых рабочих собирает основы будущего. Стартапы возникли в небольших, более дешёвых городах, и они работают, чтобы разметить огромную массу изображений и видео. Если Китай является Саудовской Аравией данных, как говорит один из экспертов, эти предприятия являются нефтеперерабатывающими заводами, превращая необработанные данные в топливо, которое может напитать амбиции Китая в области Искусственного Интеллекта.

Обычная мудрость гласит, что Китай и США конкурируют в области ИИ-превосходства, и что у Китая есть определённые преимущества. Китайское правительство в целом поддерживает ИИ-компании финансово и политически. Китайские стартапы составляли треть мирового рынка компьютерного зрения в 2017 году, превосходя США. Китайские научные статьи всё чаще цитируются в научных изданиях. В заявлении о ключевой политике в прошлом году правительство Китая обозначило, что ожидает, что к 2030 году страна станет мировым лидером в области Искусственного Интеллекта.

Самое главное, что китайское правительство и компании пользуются доступом к горам данных, благодаря слабым законам о конфиденциальности и обеспечению их соблюдения. Помимо тех данных, что накоплены Facebook, Google и Amazon, китайские интернет-компании могут получить ещё больше, потому что люди там так активно используют свои мобильные телефоны для покупки, оплаты за питание и покупки билетов в кино.

Хоу Сяменг управляет фабрикой данных из своего бывшего завода по производству цемента в городе Хэбэй Нангунши.
Хоу Сяменг управляет фабрикой данных из своего бывшего завода по производству цемента в городе Хэбэй Нангунши.

Тем не менее, многие из этих претензий являются, конечно, пустыми. Китайские документы и патенты могут быть подозрительными. Правительственные деньги могут пойти впустую. Неясно, является ли гонка вооружений в области Искусственного Интеллекта игрой с нулевой суммой, в которой победитель получает всё. Данные бесполезны, если никто не может их разобрать и каталогизировать.

Но способность размечать эти данные может лежать в основе истинной силы в ИИ — единственной, с которой США не могут сравниться. В Китае эта новая отрасль предлагает взгляд на будущее, которое правительство давно обещало: экономика построена на технологии, а не на производстве.

«Мы строители в цифровом мире. Наша задача — заложить один кирпич за другим», — говорит Йи Яке, соучредитель фабрики по разметке данных в городе Цзясиан в центральной провинции Хэнань. — «Но мы играем важную роль в ИИ. Без нас они не смогут построить небоскрёбы».

Хотя ИИ-системы представляют собой сверхбыстрых учеников, которые хорошо справляются со сложными расчётами, им не хватает когнитивных способностей, которыми обладают даже средние 5-летние дети. Маленькие дети знают, что пушистый коричневый кокер-спаниель и чёрный дог — обе собаки. Они могут назвать пикап Ford названием Volkswagen Beetle, и всё же они знают, что это — автомобили.

ИИ необходимо обучать. Он должен переваривать огромное количество размеченных фотографий и видео, прежде чем он поймёт, что чёрная кошка и белая кошка — обе кошки. Вот здесь и появляются фабрики данных и их рабочие.

Разметчики помогли компании AInnovation, основанной в Пекине, исправить свою автоматизированную систему для кассиров в китайской пекарне. Пользователи могли поставить свои покупки под сканер и заплатить за них без помощи человека. Но почти треть времени у системы возникали проблемы с распознаванием кексов, пончиков или свиных булочек из-за освещения магазина и движений людей, что делало изображения более сложными. Разметив фотографиями из интерьера магазина, разметчики получили точность до 99 %, сказал Лян Руи, менеджер проекта AInnovation.

«Весь Искусственный Интеллект построен на человеческом труде», — говорит товарищ Лян.

В компании AInnovation меньше 30 разметчиков, но всплеск появления стартапов для разметки упростил работу. Однажды товарищу Ляну понадобилось сдать около 20 000 фотографий из супермаркета, которые надо было разметить за три дня. Коллеги сделали это с помощью таких фабрик всего за пару тысяч долларов.

«Мы — сборочные линии, как это было 10 лет назад», — говорит товарищ Йи, соучредитель фабрики данных в Хэнань.

Фабрики данных появляются в районах, далёких от крупнейших городов, часто в относительно отдалённых районах, где дёшево работают как рабочие, так и офисные помещения. Многие из работников фабрики данных — это люди, которые когда-то работали на сборочных линиях и строительных площадках в этих больших городах. Но работа останавливаемся, рост заработной платы замедляется, а многие китайцы предпочитают жить ближе к дому.

36-летний товарищ Йи был уволен с работы и пытался привлечь другие предприятия к работе с учениками начальной школы, когда кто-то упомянул разметку для ИИ. После онлайн-поиска он решил, что это не супер-техничный, а довольно дешёвый труд, чего в провинции Хэнань в изобилии.

В марте товарищ Йи и его друзья создали компанию Ruijin Technology, которая арендует офисы размером с две профессиональные баскетбольные площадки в индустриальном парке за 21 000 долларов в год. Раньше это было помещение Партийного комитета, поэтому потолочные светильники покрыты красными молотками и серпами.

Слово «ruijin» означает «умное золото», и в компании в настоящее время насчитывается 300 рабочих, но планируется расширение до 1000 после китайского новогоднего праздника, когда многие рабочие-мигранты возвращаются домой.

В отличие от работников и бизнеса во всем мире, товарищ Йи не беспокоится, что Искусственный Интеллект отнимет у него работу.

«Машины ещё недостаточно умны, чтобы самостоятельно учить себя», — говорит он.

Больше беспокоит наем рабочей силы.

Компания Ruijin платит от 400 до 500 долларов в месяц, что выше, чем в среднем по городу. Некоторые потенциальные кандидаты на работу опасаются, что они ничего не знают об ИИ. Другие находят работу скучной.

19-летний Инь Вэйсянь говорит, что после китайского Нового года он покинет компанию Ruijin и отправится продавать мебель в оффлайн-магазине в южном городе Гуанчжоу.

«Мы строители в цифровом мире. Наша задача — заложить один кирпич за другим», — говорит Йи Яке, соучредитель компании Ruijin Technology.
«Мы строители в цифровом мире. Наша задача — заложить один кирпич за другим», — говорит Йи Яке, соучредитель компании Ruijin Technology.
«Я человек из простого народа», — говорит товарищ Цзинь. — «Я просто размечаю данные за деньги».

Но для некоторых бывших рабочих-мигрантов эта работа лучше, чем работа на сборочных линиях.

«Это одна и та же работа, одно и то же движение, изо дня в день», — говорит Йи Чжэньчжэнь, 28-летний сотрудник компании Ruijin, который когда-то работал в компании электронных компонентов. — «Теперь мне нужно немного поработать над моим мозгом».

В большинстве случаев клиенты не сообщают этим фабрикам данных, для чего предназначена задача. Некоторые из них очевидны. Маркировка светофоров, дорожных знаков и пешеходов обычно предназначена для беспилотных автомобилей. Маркировка многих типов цветов камелии может использоваться для поисковых систем.

Однажды компании Ruijin была поручена разметка миллионов изображений человеческих ртов. Товарищ Йи сказал, что не уверен, для чего это нужно. Может быть, распознавание лиц?

Примерно в 300 милях к северу, в городе Хэбэй Нангунши, Хоу Сяменг управляет своей фабрикой по разметке данных из своего бывшего завода по производству цемента. Её первая работа в колледже заключалась в разметке лиц для Megvii, китайской компании по распознаванию лиц с оценкой в ​​2 миллиарда долларов, наиболее известной своей технологической платформой под названием Face++. По сей день некоторые системы распознавания лиц признают её, прежде чем они распознают её друзей, потому что, по её словам, «моё лицо находится в исходной базе данных».

Но жизнь в Пекине была слишком сложной и дорогостоящей. Она и её тогдашний жених Чжао Ячень решили вернуться в свой родной город и запустить фабрику данных. Родители товарища Хоу заплатили за компьютеры и столы. Они ремонтируют склад по соседству, чтобы нанять ещё 80 человек.

Как и товарищ Йи, товарищ Хоу не тратит время на размышления о последствиях её работы. Вносят ли они вклад в дистопическое будущее, в котором машины будут контролировать человека?

«Камеры заставляют меня чувствовать себя в безопасности», — сказала она. — «На данный момент мы контролируем машины».