Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез - 23

Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат


При включении в конъюнктивные (+)- и (–)-фильтры включить признак «Уровень S100» были получены интересные результаты (Таблица ). Через «Ф+» обозначим положительный фильтр, а через «Ф–» – отрицательный.

При увеличении числа родителей для (+)-гипотез до 5 степень абдуктивности равна 0,75, поэтому в эксперименте с применением фильтров 4 – это максимально допустимый порог родителей для (+)-гипотез.

Таблица - Результаты применения запрета на контрпримеры и фильтров к онкологическим данным (продолжительность жизни больше/меньше 12 месяцев)



Параметр



Эксперимент 1

&

Ф+Ф



Эксперимент 2

&

Ф+Ф



Количество (+)-примеров

32

Количество (–)-примеров

11

Количество (τ)-примеров

3

Порог родителей для (+)-гипотез

2


4

Порог родителей для (–)-гипотез

2

Порог родителей для (0)-гипотез

2

Количество (+)-гипотез

535

240

Количество (–)-гипотез

14

14

Количество доопределенных (τ)-примеров

1

1

Число итераций индукция-аналогия

2

Количество необъясненных (+)-примеров

3

3

Количество необъясненных (–)-примеров

0

0


В экспериментах с фильтрами процедура «доопределение по одному» верно доопределила 18 примеров в первом эксперименте и 17 во втором. Количество ошибок доопределения (с «+» на «–» или с «–» на «+») равно 11 в первом и во втором экспериментах.

При рассмотрении значения признака «Уровень S100» в гипотезах, полученных во втором эксперименте с применением фильтров, получаем:

из (+)-гипотез 195 имеют значение «до 0,120», 43 – «0,120-1», 2 – «свыше 1»;

из (–)-гипотез 5 имеют значение «до 0,120», 7 – «0,120-1», 2 – «свыше 1».

Таким образом, в гипотезах, полученных при исследовании эффекта «Продолжительность жизни больше или меньше 12 месяцев», четкой закономерности между продолжительностью жизни и значением признака «Уровень S100» нет. Однако, очевидно, что общая тенденция «значение S100 до 0,120 –> продолжительность больше 12 месяцев», «значение S100 выше 0,120 –> продолжительность меньше 12 месяцев» все-таки просматривается.

В Таблице 30 приведены результаты, полученные на фармакологических данных.

Таблица - Результаты применения запрета на контрпримеры к фармакологическим данным



Параметр



Значение



Количество (+)-примеров

14

Количество (–)-примеров

48

Количество (τ)-примеров

61

Порог родителей для (+)-гипотез

2


Порог родителей для (–)-гипотез

Порог родителей для (0)-гипотез

Количество (+)-гипотез

15

Количество (–)-гипотез

117

Количество (0)-гипотез

0

Количество доопределенных (τ)-примеров

61

Число итераций индукция-аналогия

1

Количество необъясненных (+)-примеров

3

Количество необъясненных (–)-примеров

5


В отличие от применения простого метода сходства (61 (τ)-пример доопределился как 0) полученные гипотезы доопределяют 18 примеров как «+», 13 примеров как «–» и 30 примеров как 0. Степень объясненности ( = 1 – (число необъясненных примеров данного знака/ общее число примеров данного знака)) находится на допустимом уровне: 0,78 для (+)-примеров; 0,89 для (–)-примеров. С использованием процедуры «доопределения по одному» верно доопределен 41 пример из 62.



    1. метод различия




В ДСМ-Решателе программно реализованы два варианта метода различия: миллевский вариант и упрощение метода соединенного сходства-различия.


      1. Метод различия: миллевский вариант




В первой главе рассмотрены предикаты, которые представляют собой прямой перевод второго правила Д.С. Милля. Недостатком миллевского метода различия является то, что он не удовлетворяет основным идеям индуктивных рассуждений Д.С. Милля [40]. Поэтому правила правдоподобного вывода-1 для метода различия не подчиняются основному принципу индукции – «сходство фактов влечет наличие (отсутствие) эффекта и его повторяемость» [13].

На реальных данных метод различия в первой формулировке (формализация схем вывода Д.С. Милля для метода различия) не дал результатов: и на данных фармакологии, и на медицинских данных было получено 0 гипотез. Это подтвердило тот факт, что данный метод не адекватен для обнаружения причинно-следственных зависимостей.

С помощью второго варианта метода различия (формализация словесной формулировки Второго правила Д.С. Милля) удалось породить гипотезы на данных фармакологии.

Сначала были проведены два эксперимента. Первый эксперимент – простой метод сходства с запретом на контрпримеры в качестве (+)- и (–)-предикатов. Стратегия второго эксперимента – метод различия Д.С. Милля с запретом на контрпримеры в качестве (+)- и (–)-предикатов. Сравнительная таблица (Таблица ) выявила тот факт, что даже после 7 тактов п.п.в.-1 и п.п.в.-2 (параметр «Число итераций индукция-аналогия»), не все (τ)-примеры были доопределены, а степень абдуктивности для (–)-примеров была значительно ниже, чем в первом эксперименте (0,73 против 0,90).

Были получены разные результаты доопределения по 38 (τ)-примерам (из 61), причем из них 24 примера простой метод сходства с запретом на контрпримеры доопределил как 0, а метод различия Д.С. Милля с запретом на контрпримеры как «+» или «–».

Таблица - Результаты сравнения метода различия Д.С. Милля и простого метода сходства (с запретом на контрпримеры) к фармакологическим данным



Параметр



Простой метод сходства с запретом на контрпримеры



Метод различия Д.С. Милля с запретом на контрпримеры



Количество (+)-примеров

14

14

Количество (–)-примеров

48

48

Количество (τ)-примеров

61

61

Порог родителей гипотез

2

2

Количество (+)-гипотез

15

35

Количество (–)-гипотез

117

98

Количество 0 гипотез

0

2

Количество доопределенных (τ)- примеров

61

58

Число итераций индукция-аналогия

1

7

Количество необъясненных (+)-примеров

3

3

Количество необъясненных (–)-примеров

5

13

Степень абдуктивности (+)

0,79

0,79

Степень абдуктивности (–)

0,90

0,73

Максимальное количество родителей у (+)-гипотез

9

15

*



Максимальное количество родителей у (–)-гипотез

13

15

*




*(гипотезы с таким количеством родителей получены за счет доопределенных ()-примеров).
Интересен тот факт, что если из эксперимента исключить (τ)-примеры, то метод различия Д.С. Милля с запретом на контрпримеры дает совсем низкий показатель степени абдуктивности для (–)-примеров (всего 0,56). Максимальное количество родителей у (+)-гипотез равно 6, а для (–)-гипотез – 7. Это значит, что доопределение (τ)-примеров дает новые знания.

Также были проведены эксперименты без запрета на контрпримеры. Результаты приведены: см. Таблица . Результат в целом по массиву получился тот же: степень абдуктивности для (–)-примеров ниже, количество родителей у порожденных гипотез меньше.

Также получены разные результаты по доопределению 15 (τ)-примеров (из 61), причем простой метод сходства доопределил их как 0, а метод различия Д.С. Милля как «–».

Таблица - Результаты сравнения метода различия Д.С. Милля и простого метода сходства к фармакологическим данным



Параметр



Простой метод сходства



Метод различия Д.С. Милля



Количество (+)-примеров

14

14

Количество (–)-примеров

48

48

Количество (τ)-примеров

61

61

Порог родителей гипотез

2

2

Количество (+)-гипотез

26

25

Количество (–)-гипотез

227

42

Количество 0 гипотез

13

4

Количество доопределенных (τ)-примеров

61

61

Число итераций индукция-аналогия

1

1

Количество необъясненных (+)-примеров

0

0

Количество необъясненных (–)-примеров

0

8

Степень абдуктивности (+)

1,00

1,00

Степень абдуктивности (–)

1,00

0,83

Максимальное кол-во родителей у (+)-гипотез

9

9

Максимальное кол-во родителей у (–)-гипотез

48

23

Эксперимент 1