Q-learning (калькированный термин — Q-обучение) — это один из алгоритмов реализации метода машинного обучения с подкреплением (reinforcement learning, RL).
Рассмотренный далее пример «Q-learning in action» может оказаться полезным для новичков в этой области.
Человечек (агент, agent) живет в плоском мире размером 11 на 11 клеток (environment):
Агент может пошагово совершать действия, а каждое действие (action) заключается в попытке перемещения на соседнюю клетку по любому из 8 направлений:
(«попытке», так как выход за границы мира запрещен — можно считать, что граница «выталкивает» агента в прежнюю позицию):
В мире агента имеются стены , которые не пускают агента на занятые ими клетки, и ловушки , «телепортирующие» агента в начальную позицию.
Состояние (state) агента на каждом шаге (step) описывается его позицией — порядковым номером клетки:
Стартовая позиция агента в начале эпизода (episode) — верхний левый угол, цель агента — достичь конечной позиции — правого нижнего угла по кратчайшему пути.
Вся прелесть алгоритма Q-learning в том, что он работает тогда, когда агент даже и не знает КАК добиться желаемого результата («model-free»).
Архив рубрики: наука
Странные книги — Тартария etc
Существуют странные карты. Но нам доступны и не менее странные книги…
Подробные исследования упомянутых книг провел польский исследователь BRUSEK KODŁUCH — https://kodluch.wordpress.com/
Итак, книжка «Wstęp Do Fizyki Dla Szkół Narodowych» («Введение в физику для народных школ» ), изданная на польском языке в Кракове в 1783 году.
Электронная версия книги доступна — https://jbc.bj.uj.edu.pl/dlibra/publication/403799/edition/420914/content?ref=desc
Автор книги — Jan Michał Hube.
И что же мы видим на странице 81:
«Cala Azya nie ma wyzszych gor nad Althayskie w Tartaryi wolney»
Мой перевод — «Вся Азия не имеет гор более высоких, чем Алтайские в Тартарии свободной»
Итак, конец XVIII века, со времен Ермака прошло более двухсот лет. Но на Алтае до сих пор Тартария?
Конечно, я в курсе о типичном возражении — «Тартария — название территории» . Но с какой стати добавлять к территории эпитет «свободная» (не «теплая», «восточная», «ветреная», а именно «свободная»)???
Читать далее
Психокинез и случайные числа
Психокинез (ПК) (psychokinesis (PK)) — это явление, заключающееся в возможности сознания влиять на материальный мир.
Заинтересовало меня это явление после знакомства с удивительной книжкой Майкла Талбота «Голографическая вселенная» («The Holographic Universe» ) :
Майл Талбот (Michael Talbot)
Одним из проявлений психокинеза является микропсихокинез (micro-PK), а именно — возможность «силой мысли» влиять на системы и явления, подчиняющиеся законам статистики. Примером такого явления служит процесс радиоактивного распада.
Для экспериментальной проверки явления психокинеза можно использовать генератор случайных чисел на основе счетчика Гейгера (генератор случайных событий — random event generator (REG)). Изменение распределения генерируемых случайных чисел при мысленном воздействии подтвердит эту необычную гипотезу.
Впервые счетчик Гейгера в подобных экспериментах использовал физик Хельмут Шмидт (Helmut Schmidt), в конце 1960-х годов, наблюдавший радиоактивный распад стронция-90:
Он заявлял о вариации 1-2% из-за явления психокинеза.
А вот как в книге «Голографическая вселенная» описываются такие эксперименты, проводимые Брендой Дюнн (Brenda Dunne) и Робертом Джаном (Dr. Robert Jahn) в Принстонском инженерном центре по изучению аномальных явлений (Princeton Engineering Anomalies Research (PEAR)):
Экспериментаторы описали свои исследования в книге «Consciousness and the Source of Reality«:
Выпускаются даже специальные наборы для проверки психокинеза:
Старая подвижная карта звездного неба
До появления специализированных астрономических программ у любителей астрономии были популярны подвижные карты звездного неба (англ. planisphere).
Такая карта состоит из круга, на котором нанесены звезды и созвездия, координатная сетка, а по краям размечены дни и месяцыгода, и подвижной накладки с вырезом, соответствующим широте местности, на которой размечены часы.
Совмещая деление, соответствующее текущему часу, на подвижной накладке с делением на круге-основании, соответствующему текущему дню, мы в вырезе накладки наблюдаем видимые в этот момент звезды и созвездия.
Я нашел такую старую звездную карту:
На ней была надпись, сделанная, скорее всего, моим дядей, увлекавшимся астрономией:
«АВГУСТ
Созвездие Девы на Ю-З — Юпитер
На Ю (Змееносец) — Сатурн
На В (Овна) — Марс»
Но эта надпись не была датирована! Мне захотелось сделать датировку этого артефакта…
Читать далее
Иероглифы Древнего Египта
Вот так выглядит имя ALEXEY , записанное египетскими иероглифами:
Основные иероглифы для древнеегипетского алфавита выглядят так:
Освобождение Гомеля и окрестностей в 1943 году, бои за Хальч
… Не верьте пехоте,
когда она бравые песни поет. …
Булат Окуджава
Сражение, в ходе которого был освобожден Гомель, в немецких источниках ([10]) получило название «die Schlacht von Gomel».
Эпизод Битвы за Днепр
Я попытался восстановить хронологию событий, происходивших в окрестностях Гомеля со второй декады октября по конец ноября 1943 года.
3 октября фронт еще располагался на удалении от Гомеля, что подтверждается немецкой картой с разведанными, показывающими положение советских войск [36]:
10 октября
К 10 октября германский фронт был прорван и немецкие войска отступили к Гомелю, что показано ситуационной карте «Lage Ost» за 10 октября 1943 года:
Как видно из карты, немецкие войска заняли оборону на правом берегу реки Сож, в частности между Гомелем и Веткой оборону держала 134-я пехотная дивизия, которым противостояли советские 399-я и 307-я стрелковые дивизии.
Вблизи Гомеля расположилась 299-я пехотная дивизия, отступившая из района Добруша.
Южнее Гомеля оборонялись 292-я, 45-я и 216-я пехотные дивизии.
Читать далее
Без Луны…
Итак, случилось ожидаемое даже далекими от астрономии людьми частное солнечное затмение 20 марта 2015 года. Луна закрыла Солнце больше чем наполовину, вызвав восторг публики. Кстати, вот мои скромные результаты наблюдения этого редкого события — http://acdc.foxylab.com/node/31 .
Но, возможно, что Луна на нашем небосводе появилась не так уж и давно по историческим меркам.
Примеры силы землетрясений
Энергия, выделившуюся при землетрясении в виде сейсмических волн, характеризуется безразмерной величиной, называемой магнитуда. Первоначальная шкала магнитуды была предложена в 1935 году американским сейсмологом Чарльзом Рихтером.
Сильнейшее зарегистрированное землетрясение (Великое Чилийское землетрясение) произошло в Чили 22 мая 1960 года — его магнитуда составляла 9,5.
фотография разрушений [http://www.angelfire.com/nt/terremotos/]
Читать далее
Самые дорогие вещества
Самым дорогим металлом является калифорний-252 — $60 за микрограмм в 1999 году (т.е. цена 1 грамма составляет 60 млн. долларов!!!).
http://en.wikipedia.org/wiki/Californium
Самым дорогим органическим веществом является ксестоспонгин C — Xestospongin C — цена составляет $179 за 10 микрограмм (т.е. цена 1 грамма составляет $17 900 000 — больше 17 млн. долларов!!!
http://www.tocris.com/dispprod.php?ItemId=2235